1对象和方法
以13名无眼科知识及眼科临床工作经验者无眼科知识及眼科临床工作经验者为对象,进行6mo的眼科知识教育及眼底照片读片培训. 1名DR专科教授为专业读片人。读片用眼底彩色照片包括标准眼底照片来源于东京女子医科大学糖尿病研究中心,经日本糖尿病眼科学会DR评审委员会筛选,依据眼底照片的清晰度、成像区域、眼底征象分级变量等最终选定50张50°4个视野(中心固视的正面,包含视盘的鼻侧及颞上下侧)彩色眼底照片及19张标准眼底照片[6]。
普通读片者对照日本糖尿病眼科学会选定的标准眼底照片和读片准则,在盲法下用DR早期治疗研究组(ETDRS)的读片法,进行前后2次读片(前后读片),其间间隔2wk,记录11项DR眼底病变指标。眼底征象分为“无”、“可疑”、“比标准照轻”、“与标准照相同或较重”、“不能分类”(因DR引发视网膜前出血或玻璃体积血、视网膜脱离等无法进行眼底读片)5种情况,具体分类和记录为: Grading 0(G0): 无症状; Grading 1(G1): 症状可疑;Grading 2(G2): 症状比标准照A轻;Grading 3(G3): 症状与标准照A相同或较重、比标准照B轻;Grading 4(G4): 症状与标准照B相同或较重、比标准照C轻;Grading 5(G5): 症状与标准照C相同或较重;Grading 8(G8): 不能分类(表1)。
统计学处理:方法为Statistical Analysis System(SAS),Vver8.2。运用κ、加权κ(κw)统计值, 级内相关系数,通过Grader对DR眼底照片的读片结果的一致性程度来评价Grading的信赖性。κ在 0~1的范围中,数值越大、Grading一致性越高,也即信赖性越高。κ为1,表示Grading完全一致;κ为0,表示Grading完全不一致。数据离散程度的指标用标准误(SE)来说明,κ信赖区间CI为κ±1.96SE(95%)范围。 以Fleiss[7]的统计解析理论为判断标准, κ≥0.75:一致性为Excellent;0.60≤κ<0.75:Good;0.40≤κ<0.60:Fair;κ≤0.40:Poor。加权κ(κw) 统计值Κw是对每个观察值根据一致程度赋予权数,然后再根据公式计算得到的加权值,从而考虑到每个观察值对一致性的影响[7]。我们采用的加权κ的权数为:
W■=1-(I-j)■÷(k-1)■ (i=1,…,k; j=1,…,k)
P0(w)=P■=■■W■O■/n
P■=■■W■E■/n
=(P■-P■)/(1-P■)
为了确认不同读片者对于同一眼底照片的读片结果的一致性,我们还计算了级内相关系数(ICC)[7-9]。假设Yijk为读片者j对眼底照片i的第k次读片结果,建立了以下的随机区组模型。Yijk=μ +Fi +Gj +e ijk
记常数为μ,眼底照片的效应为Fi,读片者的效应为Gj,随机误差为e ijk。眼底照片的效应Fi服从均数为0,方差为σF2的正态分布。读片者的效应Gj服从均数为0,方差为σG2的正态分布。随机误差服从均数为0,方差为σe2的正态分布。根据所得读片结果对上述3种方差进行推定,从而算出级内相关系数。ICC=■如果ICC接近于1,说明读片者的效应对读片结果影响较小,读片者间一致性较高。
2结果
读片用彩色眼底照片包括标准眼底照片是由东京女子医科大学糖尿病研究中心提供,经日本糖尿病眼科学会DR评审委员会筛选。标准眼底照片的眼底征象分布即Grading由日本糖尿病眼科学会DR评审委员会讨论决定。50张眼底彩色照片的眼底征象分布由DR专业读片人在对照了标准眼底照片(19张)后得出(表2)。
2.1普通读片者与DR专业读片者读片结果比较 用κ、κw方法来评价13名普通读片者与DR专业读片者读片结果比较。普通读片者对一张眼底照片读片时间定为3min。11项DR眼底病变指标读片结果κ为0.45~1.00(SE:0.00~0.14),κw:0.52~1.00(SEw:0.00~0.15);后读片11项指标读片结果κ为0.37~1.00(SE:0.00~0.14)、κw:0.43~1.00(SEw:0.00~0.13)HMA:前判定中9名读片者κ>0.76,4名κ为0.62~0.74;后判定中6名κ>0.77,7名κ为0.69~0.74。SH/FH:前判定中11名κ>0.75,2名κ为0.72;后判定中13名读片者均为κ>0.81。HE:前判定中9名κ>0.76,4名κ为0.65~0.69;后判定中8名κ>0.76,4名κ为0.61~0.72, 1名κ为0.58。SME:前判定中12名κ>0.80,1名κ为0.62;后判定中11名κ>0.79,2名κ为0.69~0.71。SE:前判定中11名κ>0.75,2名0.63~0.72;后判定中9名κ>0.75,3名κ为0.70~0.73,1名κ为0.56。IRMA:前判定中9名κ>0.86,3名0.60~0.73, 1名κ为0.45;后判定中9名κ>0.76,3名κ为0.63~0.69,1名κ为0.37。AS:前判定中12名κ>0.80, 1名κ为0.55;后判定中11名κ>0.85,2名κ为0.60~0.73。VB:前判定中10名κ>0.77,1名κ为0.72, 2名κ:0.48~0.50;后判定中9名κ>0.78,3名κ:0.69~0.73,1名κ为0.59。VL:前判定中12名κ>0.90,1名κ为0.74;后判定中13名κ>0.80。VS:前判定中12名κ>0.83,1名κ为0.64;后判定中10名κ>0.80,3名κ为0.62~0.74。NV:前判定中12名κ>0.81,1名κ为0.73;后判定中12名κ>0.79,1名κ为0.55。13名读片者的读片结果中,前判定中每一项眼底征象至少有9名以上κ为0.75, 后判定中每一项眼底征象至少有6名以上κ0.75, 显示了极高的一致性。只有1名读片者的IRMA的后判定κ<0.40, 显示了完全不一致(表3)。普通读片者与DR专业读片者前-后判定结果比较一致(κ, κw ,图1)。
2.2普通读片者前后读片结果比较 评价13名普通读片者各自对同一眼底照片前后2次读片结果的一致性程度。11项DR眼底病变指标读片结果κ值为0.49~1.00(SE:0.00~0.15),κw为0.56~1.00(SEw:0.00~0.15), 其中HMA:12名读片者κ>0.76,1名κ:0.69;SH/FH:12名κ>0.81,1名κ:0.72,HE:11名κ>0.77,2名κ:0.67、0.73;SME:12名κ>0.82,1名κ:0.68;SE:12名κ>0.75,1名κ:0.74;IRMA:11名κ>0.78,1名κ:0.67,1名κ:0.55;AS:13名κ>0.80;VB:7名κ>0.91,4名κ:0.61~0.73,2名κ:0.49、0.57;VL:13名κ>0.85;VS:11名κ>0.76,2名κ:0.73、074 ;NV:13名κ>0.82。13名读片者AS,VL,NV的读片结果κ>0.75,显示了极高的一致性。读片者内前后读片结果没有出现κ<0.40的结果(表4)。
图1 普通读片者与DR专业读片者结果比较(前-后判定的κ和κw)(n =50)
2.3 普通读片者间读片结果的比较 13名普通读片者间对同一眼底照片前、后读片,前读片11项DR眼底病变指标读片结果κ为0.41~1.00,SE:0.00~0.14(κ平均值为0.70~0.90,SE:0.05~0.11);κw:0.39~1.00,SEw:0.00~0.15(κw平均值为0.77~0.96,SEw:0.02~0.09),后读片11项DR眼底病变指标读片结果κ为0.37~1.00,SE:0.00~0.14(κ平均值为0.63~0.89, SE:0.06~0.11),κw:0.42~1.00,SEw:0.00~0.15(κw平均值为0.70~0.97, SEw:0.02~0.10)。以κ 平均值来分析读片结果, SH/FH,SME,AS,VL,NV的前判定和后判定结果κ>0.75, 结果显示了极高的一致性;HMA,HE,SE,IRMA,VB的前判定和后判定结果0.63,κ<0.74,结果显示了较高的一致性。VS前判定结果κ=0.86, 结果显示了极高的一致性,VS后判定结果κ=0.72,结果显示了较高的一致性(图2)。
图2 普通读片者间读片结果κ、κw的比较(n =50)
2.4级内相关系数 R2 接近0,读片样本相关性越差。R2接近1,读片样本相关性越强。统计分析表明SME,VL R2 > 0.9538, 读片样本相关性较强;IRMA R2:0.7919,HMA= 0.9452,SH.FH=0.9262,HE=0.8993,SME=0.9538,SE=0.8984,IRMA = 0.7919,SA=0.8658,VB=0.8544,VL=0.9768,VS=0.8619,NV =0.9280。其中IRMA R2最差。
上一页 [1] [2] [3] 下一页 |