论文部分内容阅读
摘 要:[目的/意义]健康网站信息文本的可读性水平直接影响公众对健康信息的加工认知过程,进而影响用户与健康有关的决策以及网站自身的发展。[方法/过程]通过对国内外可读性计算方法原理的梳理和辨析构建面向中文健康信息的可读性计算公式,选取中国健康教育网站中食品安全健康教育材料进行可读性计算和评价,从年份、来源网站性质和阅读次数3个方面分析中文食品安全在线健康教育信息可读性情况。[结果/结论]中文食品安全在线健康教育信息可读性整体不高但呈增强趋势;不同性质的来源网站之间健康信息可读性存在差异,其中政府机构网站健康信息可读性最强,综合性网络媒体次之,专业性网络媒体健康信息可读性最弱;在线健康教育材料阅读次数与材料内容可读性值不相关而与材料标题可读性值负相关,材料标题可读性值的分指标医学专业术语占比显著负向影响材料阅读次数。
关键词:可读性计算;在线健康信息;健康教育材料;食品安全
DOI:10.3969/j.issn.1008-0821.2020.05.014
〔中图分类号〕G252 〔文献标识码〕A 〔文章编号〕1008-0821(2020)05-0111-11
An Empirical Study on Readability Calculation and Application of
Chinese Online Health Education Information
——A Case Study of Food Safety
Qin Qin Ke Qing Ding Songyun
(School of Information Management,Nanjing University,Nanjing 210023,China)
Abstract:[Purpose/Significance]The readability level of health websites information directly affects the publics cognitive process of health information,thus affecting users health-related decisions and the development of the website.[Method/Process]The readability calculation formula of Chinese health information online was constructed by reviewing the principles of readability calculation methods at home and abroad.Health education materials of food safety in Chinese health education Network were selected for readability calculation and evaluation.The readability of Chinese food safety health information online was analyzed from time,characters of source websites and views.[Result/Conclusion]The readability of Chinese health education information online was low but becoming better in recent years,there were differences in the readability of health information between different characters of websites,information on government websites was the most readable,followed by comprehensive network media,and information on professional network media was the least readable,the views of materials was negatively related to the readability value of material titles,and the proportion of medical terms negatively affected the views of materials significantly.
Key words:readability calculation;health information online;health education materials;food safety
健康信息是指與人们身心健康相关的医学知识、保健知识、健康服务等,健康教育材料是健康教育传播活动中健康信息的载体[1-2]。生态环境恶化问题的加剧不断威胁人类生存条件和身体健康,公众对于健康信息和健康服务的需求也更加多样化和实时性,越来越多的人不满足于通过传统的实体渠道向医生和医疗机构寻求健康咨询和治疗指导,而是主动、积极地从互联网上搜寻获取健康相关信息。因而互联网上提供的各种以健康教育为目的的健康材料成为人们了解疾病知识、掌握药物信息、寻求治疗方式的重要信息源。在这种背景下,健康教育材料的可读性成为影响健康信息加工认知效率的重要因素。可读性也称易读性(Readability),Dale E等[3]将其定义为“文本材料所包含的影响读者有效使用的所有要素及其之间相互作用的总和”。健康网站教育材料可读性的强弱影响用户对健康信息的理解程度以及所作健康决策的合理性,对在线健康信息可读性进行评价一方面可以帮助健康信息用户选择适合自己阅读水平的阅读材料,从而更加便捷、有效地浏览健康信息并作出健康决策;另一方面可以帮助健康网站建设者更清晰地认识网站定位,完善网站建设。本文构建面向中文健康信息的可读性计算公式,并选取中国健康教育网站中食品安全在线健康教育材料进行可读性实证评价,从年份、来源网站性质和阅读次数3个方面分析食品安全在线健康信息可读性,并针对各指标提出可读性改善措施。 1 在线健康信息可读性相关研究
1.1 在线健康信息可读性
国外学者对于在线健康信息可读性的研究大致分为两类:第一,对健康信息可讀性计算公式进行梳理的综述研究[4-5];第二,利用可读性计算公式对在线健康信息可读性水平进行评估的应用研究,包括对保健类[6]和疾病类[7-8]医疗健康信息可读性的研究,对政府机构[9]、非营利性组织[10]和商业健康网站[11]可读性的研究,以及对不同语种健康信息可读性[12]的研究。一些学者在计算可读性的同时还对在线健康信息的内容[13]、质量[13-15]和准确性[14-16]进行评价。国外关于在线健康信息可读性的研究主要考虑客观文本因素,对客观非文本因素和主观因素的研究鲜见。采用可读性计算公式评估方式虽然能够简单、快速地量化文本的可读性,但忽视了健康信息用户的经验、动机等主观因素以及网站界面设计、网站交互性等客观非文本因素的影响。为完善对非文本因素影响的评估,一些学者还开发了属性清单[17]和等级量表[18]等辅助评估工具对可读性计算方法进行改善。
国内学者对于可读性的研究主要包括对可读性公式的探讨和对教材、文学作品、新闻报刊等文本可读性的定性研究、理论研究,针对健康信息可读性的实证研究,尤其是利用可读性评测工具对在线健康信息可读性进行评价的实证研究十分少见。苟梦野等[19]利用总字数、平均句长、甲级词比、乙级词比、丙级词比、丁级词比、医学主题词比、情感词极性值8个指标对糖尿病和乳腺增生病健康网站可读性进行综合评分。
1.2 可读性计算公式
国外常用的可读性计算公式主要包括SMOG[20]、Fog[21]、Flesch Reading Ease(FRE)[22]、Flesch-Kincaid(F-K)[23]、Fry[24],其中FRE和F-K公式在国外学者的健康信息可读性研究中应用最普遍,而SMOG公式因其容易理解和便于使用的特点更适用于医疗健康领域可读性的研究[25]。梳理国外常用可读性计算公式指标含义、评价标准、评价水平、优缺点和应用,见表1。
国内关于可读性的研究起步较晚,发展较缓慢,利用计算公式对文本进行可读性计算和评估的研究较少,选择Yang S[36]、孙汉银[37]、荆溪昱[38]、郭望皓[39]和李萍[40]提出的计算公式作为国内代表性可读性计算公式。梳理各可读性计算公式指标含义、评价标准、评价水平和优缺点,见表2。
国外的可读性计算公式有相对应的评价标准,能够将可读性计算结果与阅读水平对照得出阅读材料适合的年级阅读水平,但公式仅仅将句子长度、文本长度和单词音节数作为可读性衡量标准,而忽视了各行业领域专业词汇对于可读性的重要影响。国内的可读性计算公式对于常用字/词和不常用字/词的划分标准不统一、主观性较强,而专业术语作为衡量标准的引入为改善可读性计算公式提供了新思路。鉴于中文阅读分级标准目前尚未统一以及缺乏将中文文本可读性数值和公众阅读水平标准进行对应研究的现状,难以判断不同的阅读材料可读性对应的阅读等级。
2 中文健康信息可读性计算公式的构建
在现有的中文可读性计算公式中,中国台湾地区学者荆溪昱提出的公式最为权威,他对台湾小学和中学共12个年级的中文教材进行分析,将每个学期作为一个可读性级别,选取3个变量制定可读性计算公式:
其中,R表示可读性值;X1表示不含标点符号的文章总字数;X2表示文章平均句长,即文章总字数与文章完全句数之比,完全句是指以句号、问号和感叹号结束的句子;X3表示常用字所占比例,常用字参照表为台湾国小495常用繁体字表[38]。荆溪昱提出的中文可读性计算公式效度高达0.8486[38],可推广用于一般教育材料可读性的计算。针对健康信息可读性的计算,式(1)中X1和X2指标值容易获取,而X3指标中常用字的划分标准显然不适用于健康教育材料简体中文常用字的划分。
李萍针对式(1)中的X3指标进行调整,选取篇长、平均句长和会计专业术语所占比例3个指标作为上市公司年报可读性的衡量指标,在荆溪昱公式基础上加以创新得到上市公司年报可读性计算公式:
其中,X1表示文章总字数,X2表示文章平均句长(句均字数),X3′表示会计专业术语所占比例(会计专业术语个数/总字数)[40]。式(2)仅仅对式(1)中的X3指标进行调整,将专业术语作为衡量指标引入可读性计算公式,解决了荆溪昱公式中常用字的划分标准无法推广使用的问题。另外,这一调整将常用字/词统计工作转变为非常用字/词统计工作,大大减少了工作量。遗憾的是,式(2)中的X3′指标对于字数和词数的概念模糊不清,用专业术语词数除以文章总字数得到专业术语占比,该方法的合理性有待商榷。
本研究以荆溪昱公式为基础,借鉴李萍的创新方法并加以改进,构建面向中文健康信息的可读性计算公式:
R=17.5255 0.0024×总字数 0.04415×平均句长-18.3344×(1-医学专业术语占比)(3)
式(3)中,R值代表健康信息的可读性水平,R值越小,可读性越强,健康教育材料越容易阅读。总字数=不含标点符号的材料总字数,平均句长=材料总字数/完全句数,医学专业术语占比=医学专业术语字数/总字数。式(3)仅对公式1中的X3指标进行调整,各个指标的系数参照式(1)。本研究以食品安全教育材料为例计算在线健康信息可读性,食品安全健康信息属于医疗健康信息,对食品安全健康教育材料中的医学专业术语进行统计使统计结果更加全面、完整。
3 材料与方法
3.1 文本材料 本文选择的在线健康教育信息可读性评价实证对象为中国健康教育网(http://www.nihe.org.cn/),它是一个集健康教育材料、健康新闻、健康知识科普、各省健康教育工作动态以及专业指导信息于一体的综合性网站。中国健康教育中心是国家卫生和计划生育委员会直属事业单位,中国健康教育网是中国健康教育中心的官方网站,囊括了很多其它政府门户网站和商业健康网站的健康教育材料,发布的食品安全在线健康教育信息具有一定的代表性和权威性。本研究选取了中国健康教育网健康知识版块中的食品安全健康教育材料作为可读性评价文本,该类主题下的健康材料更新至2018年7月19日,选取2013年1月4日至2018年7月19日期间发布的212篇材料作为在线健康信息可读性计算数据来源。
3.2 食品安全在线健康信息可读性计算方法
根据前文构造的式(3),对各指标的计算方法说明如下:
总字数和平均句长:在Word文档中统计各篇食品安全健康教育材料的总字数和总句数,用总字数除以总句数得到平均句长。
医学专业术语占比:医学专业术语确定的依据是LetPub网站上提供的医学健康类专业术语词典,LetPub专业医学英语词典集合了营养与食品卫生学、心理学、微生物专业医学、精神病学、内科、外科、儿科、妇产科等46个分类学科的医学专用词汇,囊括常用的医学专业术语词汇共16 229个。首先,采用Python中的Jieba分词组件对每篇食品安全健康教育材料进行分词,统计每篇材料的总词数;其次,选择LetPub专业医学英语词典作为医学专业术语词库,利用Excel的Vlookup功能将每篇材料的分词结果与LetPub专业医学词典进行对比,查找出每篇材料中的医学专业术语并统计字数;最后,用医学专业术语字数除以总字数得到每篇食品安全健康教育材料的医学专业术语占比。
4 食品安全在线健康信息可读性计算结果
4.1 可读性总体情况
计算212篇食品安全健康教育材料可读性值,结果如表3所示。由表3可知,食品安全健康教育材料之间总字数、平均句长、医学专业术语占比3个指标以及可读性值最大值和最小值悬殊,健康信息可读性差异较大。
由表4可知,可读性计算结果p值大于0.05,R值呈正态分布,具备良好的统计特征。利用柱形图展示212篇食品安全健康教育材料可读性值分布情况,结果如图1所示。
可读性值超过4的健康信息的能力才足以理解中国健康教育网上大部分食品安全健康教育材料的内容。为进一步了解国内食品安全在线健康教育信息可读性情况,从年份、来源网站性质和阅读次数3个方面分析中国健康教育网食品安全健康教育材料可读性值分布规律。
4.2 可读性年代分布特征
将健康教育材料按照年份统计,计算各年份材料总字数、平均句长、医学专业术语占比和可读性值的平均值和标准差,并利用折线图展示各年份可读性值及3个指标值的平均值变化情况,如图2所示。
由图2可知,随着时间推移,自2013年以来,食品安全健康信息可读性值均值整体呈波动式下降趋势,但变化幅度不大,反映健康信息可读性在缓慢增强,用户获取和采用健康信息的难度逐渐降低,其中尤以2016年发布的健康教育材料可读性最好(M=4.31)。根据标准差计算结果,各年份健康信息可读性之间的离散程度也具有一定的变化规律。2013年各篇材料可读性值差距较大(SD=1.96),此后差距逐渐缩小,并在2017年达到最小(SD=1.38),反映近年来健康信息来源媒体开始重视整体材料可读性的增强,呈现标准化的趋势。
折线图还反映了总字数、平均句长、医学专业术语占比3个分指标的变化情况。总字数反映了健康教育材料的篇幅,早期材料篇幅较大,自2014年开始逐渐降低,至2017年材料篇幅及各篇差异都缩减至最小(M=889.77,SD=417.81)。2018年平均总字数明显增加,是由于转载了《关于加大食品药品安全执法力度严格落实食品药品违法行为处罚到人的规定的通知》(食药监法[2018]12号),且该年份仅发布了9篇教育材料。平均句长反映了材料句子的简洁程度,2013-2018年,健康教育材料句長较稳定,简洁度无明显变化。专业术语占比反映了健康信息的医学专业程度,早期材料中医学专业术语较多,2014年开始呈波动性下降趋势,2018年医学专业术语占比降至最低(M=5.82%),表明健康网站开始缩减晦涩难懂的医学词汇,以简单易懂的表达方式向公众传达健康信息。
此外,观察3个分指标值和可读性值的变化趋势可以看出,医学专业术语占比下降幅度最大。结合式(3)中各指标值权重系数可知,医学专业术语占比降低是促使健康信息可读性增强最重要的原因。因此,食品安全健康教育材料中包含的医学专业术语逐渐减少,为健康信息可读性逐渐增强贡献了主要力量。
4.3 可读性网站性质分布特征
研究选取的食品安全健康教育材料来源于9个网站,将这些来源网站按其性质分为政府机构网站、综合性网络媒体和专业性网络媒体,计算不同性质网站食品安全健康教育材料总字数、平均句长、医学专业术语占比和可读性值的平均值和标准差,结果如表5所示。
由表5可知,政府机构网站健康教育材料可读性值平均值和标准差最小,表明政府机构网站健康教育材料可读性最强,且各篇材料之间可读性相差最小,专业性网络媒体健康教育材料可读性值平均值最大,可读性最弱。综合性网络媒体可读性值介于两者之间。根据3种性质网站各指标统计结果可知,政府机构网站材料的平均篇幅最小、医学专业性最弱且各篇材料相差最小;综合性网络媒体材料平均篇幅最大、句子最简洁但各篇材料相差最大;专业性网络媒体材料句子最冗长、医学专业性最强且各篇材料相差最大。
通过对3种性质网站健康教育材料可读性值进行单因素方差分析判断不同性质网站教育材料总体可读性值是否存在差异。上文中已对212篇食品安全健康教育材料可读性值进行正态性检验,结果显示可读性值服从正态分布。将3个网站性质作为因子对212个可读性值进行单因素ANOVA检验,得到方差齐性检验结果和ANOVA检验结果,如表6和表7所示。 由表6可知,当前自由度下的p值大于0.05,样本所来自的总体满足方差齐性要求。由表7可知,ANOVA检验统计量F为11.443,p值小于0.01,因此3个不同性质网站的食品安全健康教育材料总体可读性值均值存在差异,政府机构网站、综合性网络媒体、专业性网络媒体食品安全健康教育材料可读性值均值依次递增,即政府机构网站在线健康信息可读性最强,综合性网络媒体次之,专业性网络媒体在线健康信息可读性最弱。
4.4 可读性与阅读次数之间的关系
阅读次数体现健康信息的传播力,利用散点图展示212篇健康教育材料可读性值与阅读次数之间的关系,如图3所示。
由图3可知,健康教育材料阅读次数与可读性值之间并未呈线性趋势分布,拟合线也呈水平状,表明健康教育材料的文章内容与阅读次数之间不存在线性相关关系。
中国健康教育网对于每篇健康教育材料阅读次数的计数方法为:用户点击1次健康教育材料标题,页面成功跳转至材料内容,则视为1次阅读。因此笔者猜想,健康教育材料的阅读次数可能与每篇材料标题的可读性有关。为验证猜想,对212篇食品安全健康教育材料标题可读性进行计算,将标题的平均句长视为标题字数,则根据式(3)可得健康教育材料标题可读性计算公式:
计算212篇食品安全健康教育材料标题可读性值,利用散点图展示标题可读性值与阅读次数之间的关系,如图4所示。
由图4可知,健康教育材料阅读次数与材料标题可读性值之间关联呈线性趋势,两者存在线性相关关系。对健康教育材料阅读次数与材料标题可读性值进行相关分析,结果如表8所示。
7所示。企业招聘与培训要求与本模型理论假设基本一致,理论模型符合实际需求,可作为竞争情报人员选拔与培训的参考依据。
由表8可知,健康教育材料阅读次数与材料标题可读性值相关系数为-0.454,对相关系数的检验的双侧p值小于0.001。因此,健康教育材料阅读次数与材料标题可读性值呈负相关关系,即健康教育材料标题的可读性值越小、标题可读性越强时,材料内容的阅读次数越多。基于材料标题可读性值与材料阅读次数的线性相关关系,进一步分析标题字数、标题医学专业术语占比2个分指标与阅读次数之间的关系。将标题字数和标题医学专业术语占比作为自变量,阅读次数作为因变量,对三者进行回归分析,结果如表9和表10所示。
由表9可知,方差分析结果p值小于0.05,检验拟合的两个模型具有统计意义。根据表10的回归系数结果,发现标题字数p值大于0.05,因此剔除标题字数变量,得到回归方程:阅读次数=4725.943-14015.018×标题医学专业术语占比。回归分析结果表明,在用于计算健康教育材料标题可读性值的两个指标中,只有标题医学专业术语占比对材料的阅读次数存在显著负向影响,标题字数对阅读次数不存在显著相关性。
5 讨 论
5.1 中文食品安全在线健康信息可读性现状及存在问题
2013-2018年,中文食品安全健康信息可读性整体呈增强趋势,这一趋势主要得益于医学专业词汇的减少。健康教育材料之间的可读性差距也随年份地推移逐渐变小,教育材料对公众阅读水平的要求渐趋宽松,用户获取健康信息越来越便捷有效,有利于用户更加轻松地做出正确的健康决策。根据2019年3月修订的《中华人民共和国食品安全法实施条例》[41],国家已将食品安全知识纳入国民素质教育内容,旨在普及食品安全常识,提高全社会的食品安全意识。食品安全健康信息可读性的增强有利于公众理解健康信息,获取健康知识,为建立健全健康促进与教育体系,提高健康教育服务能力[42],从而提高全民健康素养,推进健康中国建设贡献力量。然而,通过分析研究选取的健康教育材料可读性值及3个分指标值,发现中文食品安全在线健康信息还存在以下问题:
第一,信息容量较大,句子较长。平均每篇健康教育材料字数超过1 000字,平均每句话超过40字,教育材料篇幅过长、语句切分不恰当容易造成用户阅读疲劳、逻辑混乱,导致用户难以有效获取健康信息。
第二,医学词汇较多,专业性较强。超3成食品安全健康教育材料含有10%以上的医学词汇,医学专业性较强的材料更为权威、科学,但往往给用户尤其是医学知识薄弱的用户造成理解上的困难。因此,怎样以简单易懂的方式向公众准确地传达科学的健康信息成为健康网站面临的主要挑战。
第三,教育材料之间难易程度悬殊,篇幅、句长、医学专业词汇含量都存在较大差异。其中,总字数标准差高达698,医学专业术语占比平均值为8.52%,标准差高达5.02%。闫国利等[43]研究发现,不同难度的阅读材料会影响人们的知觉广度,进而影响阅读速度和阅读效率。阅读难材料会导致认知加工负荷增大,阅读效率降低。这一研究结果与Rayner K[44]、Henderson J M等[45]对英文阅读材料的研究结果一致。因此,教育材料阅读难度差距过大不利于用户提高整体阅读效率,快速获取有效信息。
总之,中文食品安全健康信息整体可读性不高且参差不齐,健康信息用户需要具备一定程度的阅读水平,并具有一定的医学知识储备才能较好地理解健康信息,满足自身健康信息需求。
5.2 可读性与网站性质的关系
通过对来源于不同性质网站的食品安全健康教育材料样本可读性值均值进行方差分析,发现其总体均值存在差异,其中政府机构网站健康信息可读性最强,综合性网络媒体次之,专业性网络媒体健康信息可读性最弱。
政府机构网站是政务公开和政民互动的主要载体和渠道,发布的健康信息受众较广,信息接收方医学专业素养整体不高。因此,政府网站健康教育材料具备权威、惠民的特点,尤其是涉及公众食品安全这一重大民生问题,政府机构网站在线健康信息更加真实可靠,可读性、实用性更强。Risoldi C Z等[11]利用SMOG、FRE、F-K 3個公式分别对政府网站和商业网站发布的健康信息可读性进行计算,综合3个公式的计算结果发现政府网站健康信息的可读性较强。Laplante-Lévesque A等[46]分别对商业网站、非营利组织网站和政府网站发布的听力障碍相关健康信息可读性进行研究,发现三者之中政府网站健康信息可读性最强。综合性网络媒体作为国内主流媒体网站,在竞争领域中占据较大的市场份额,在社会发展中担当较大的社会责任。综合性网络媒体通过获取公众认可、赢得公众信任获取公信力,发布的健康信息在注重可读性的同时还要兼顾信息内容的专业性。专业性网络媒体提供的健康信息以健康行业资讯和医学专业知识为主,该类网站用户具备较强的医学知识,对健康信息专业性要求较高。因此,市场导向下的专业性网络媒体提供的健康信息服务最具专业性价值、最完善,发布的健康信息包含大量医学专业术语,可读性也最弱。Koo K等[7]对57个专业医学网站发布的膀胱过动症相关健康信息可读性进行分析,发现88%的在线健康信息都超出了大多数成年人的阅读能力。 5.3 可讀性对阅读次数的影响
通过对食品安全健康教育材料可读性值与材料阅读次数相关性进行分析,发现材料阅读次数与材料内容的可读性值并不存在相关趋势。这一研究结论与Farrant K等[47]、Alsoghier A等[48]学者的观点一致,他们分别对胎动和口腔疾病的网站健康信息可读性值进行计算,发现网站访问次数与网站健康信息可读性、信息浏览次数与信息可读性之间均不相关。
通过分析健康教育材料标题可读性值与材料阅读次数,发现两者呈线性负相关,利用回归分析发现标题可读性值的分指标标题医学专业术语占比与材料阅读次数显著负相关,回归系数为-14 015.018。标题是健康信息内容最简练、最集中的表现形式,承担着概括主旨、吸引读者等要务,可读性强的标题会吸引用户点击和浏览健康信息内容,从而帮助用户获取信息、提高信息的传播能力。Clarke C L A等[49]学者通过研究网络搜索中网页的文字特征对网页点击率的影响,发现网页标题的可读性是影响用户浏览行为的重要因素,标题可读性强的网页点击率更高。Duarte Torres S等[50]特别地对未成年网络用户的信息浏览行为进行研究,发现网页信息标题的可读性对儿童和青少年网络用户群体的网页浏览量都存在显著的正向影响,并且对儿童的浏览行为影响更大。
6 结 论
本文对国内外可读性计算公式进行梳理和辨析,根据健康信息特点,在权威公式的基础上构建面向中文健康信息的可读性计算公式。利用公式对中国健康教育网食品安全在线健康教育材料可读性进行计算,发现中文食品安全健康信息整体可读性不高,信息容量较大,句子较长;医学词汇较多,专业性较强;教育材料之间难易程度悬殊,篇幅、句长、医学专业词汇含量都存在较大差异。从年份、来源网站性质和阅读次数3个方面分析健康信息可读性,发现近年来可读性呈增强趋势;在不同性质的来源网站中,政府机构网站健康信息可读性最强,综合性网络媒体次之,专业性网络媒体健康信息可读性最弱;在线健康教育材料阅读次数与材料内容可读性值不相关而与材料标题可读性值负相关,其中材料标题医学专业术语占比显著负向影响材料阅读次数。研究的局限性在于,目前国内缺乏与可读性计算公式对应的中文阅读水平分级标准,因此只能对在线健康信息可读性值本身进行评价和分析,这也是中文文本可读性研究亟需解决的问题。
参考文献
[1]Elliott B J,Polkinhorn J S.Provision of Consumer Health Information in General Practice[J].British Medical Journal,1994,308(6927):509-510.
[2]田本淳,董蕾.平面健康教育材料设计制作使用与评价[M].北京:北京大学医学出版社,2011.
[3]Dale E,Chall J S.The Concept of Readability[J].Elementary English,1949,26(1):19-26.
[4]Beaunoyer E,Arsenault M,Lomanowska A M,et al.Understanding Online Health Information:Evaluation,Tools,and Strategies[J].Patient Education and Counseling,2017,100(2):183-189.
[5]Daraz L,Morrow A S,Ponce O J,et al.Readability of Online Health Information:A Meta-Narrative Systematic Review[J].American Journal of Medical Quality,2018,33(5):487-492.
[6]Skierkowski D D,Florin P,Harlow L L,et al.A Readability Analysis of Online Mental Health Resources[J].American Psychologist,2019,74(4):474-483.
[7]Koo K,Shee K,Yap R L.Readability Analysis of Online Health Information About Overactive Bladder[J].Neurourology and Urodynamics,2017,36(7):1782-1787.
[8]Wong K,Levi J R.Partial Tonsillectomy:Content and Readability of Online Health Information[J].Annals of Otology,Rhinology and Laryngology,2017,126(3):192-198.
[9]Tulsieram K L,Arocha J F,Lee J.Readability and Coherence of Department/Ministry of Health HPV Information[J].Journal of Cancer Education,2018,33(1):147-153.
[10]Walsh T M,Volsko T A.Readability Assessment of Internet-based Consumer Health Information[J].Respiratory Care,2008,53(10):1310-1315. [11]Risoldi C Z,Gregory P,Wilson A.Readability of Consumer Health Information on the Internet:A Comparison of U.S.Government-funded and Commercially Funded Websites[J].Journal of Health Communication,2012,17(9):1003-1010.
[12]Berland G K,Elliott M N,Morales L S,et al.Health Information on the Internet:Accessibility,Quality,and Readability in English and Spanish[J].Journal of the American Medical Association,2001,285(20):2612-2621.
[13]Patton L L,George S F,Hollowell R P.Content,Quality,and Readability of Website Information on Dental Care for Cancer Patients[J].Oral Surgery,Oral Medicine,Oral Pathology and Oral Radiology,2014,118(1):78-83.
[14]Garfinkle R,Wong-Chong N,Petrucci A,et al.Assessing the Readability,Quality and Accuracy of Online Health Information for Patients with Low Anterior Resection Syndrome Following Surgery for Rectal Cancer[J].Colorectal Disease,2019,21(5):523-531.
[15]Cisu T I,Mingin G C,Baskin L S.An Evaluation of the Readability,Quality,and Accuracy of Online Health Information Regarding the Treatment of Hypospadias[J].Journal of Pediatric Urology,2019,15(1):40.e1-40.e6.
[16]Storino A,Castillo-Angeles M,Watkins A A,et al.Assessing the Accuracy and Readability of Online Health Information for Patients with Pancreatic Cancer[J].JAMA Surgery,2016,151(9):831-837.
[17]Strachan P H,De Laat S,Carroll S L,et al.Readability and Content of Patient Education Material Related to Implantable Cardioverter Defibrillators[J].Journal of Cardiovascular Nursing,2012,27(6):495-504.
[18]Shoemaker S J,Wolf M S,Brach C.Development of the Patient Education Materials Assessment Tool(PEMAT):A New Measure of Understandability and Actionability for Print and Audiovisual Patient Information[J].Patient Education and Counseling,2014,96(3):395-403.
[19]茍梦野,赵文龙,侯筱蓉,等.面向公众的网络健康信息可读性现状及对策探析——基于常见病症的定量研究[J].中国卫生事业管理,2019,36(2):157-160.
[20]McLaughlin G H.SMOG Grading:A New Readability Formula[J].J Read,1969,(12):639-646.
[21]Gunning R.The Technique of Clear Writing[M].New York:McGraw-Hill Book Company,1968.
[22]Flesch R F.A New Readability Yardstick[J].J Appl Psychol,1948,32:221-233.
[23]Kincaid J P,Fishburne R P,Rodgers R L,et al.Derivation of New Readability Formulas(Automated Readability Index,Fog Count and Flesch Reading Ease Formula)for Navy Enlisted Personnel[J].Springfield,IL:Naval Technical Training Command,1975,RBR-8-75.
[24]Fry E.A Readability Formula That Saves Time[J].J Reading,1968,(11):513-516,575-578. [25]Wang L W,Miller M J,Schmitt M R,et al.Assessing Readability Formula Differences with Written Health Information Materials:Application,Results,and Recommendations[J].2013,9(5):503-516.
[26]Crabbs L M,McCall W A.Standard Test Lessons in Reading[J].Teachers College Record,1925,27(3):183-183.
[27]Hansberry D R,Patel S R,Agarwal P,et al.A Quantitative Readability Analysis of Patient Education Resources from Gastroenterology Society Websites[J].International Journal of Colorectal Disease,2017,32(6):917-920.
[28]Sax L,Razak A,Shetty K,et al.Readability of Online Patient Education Materials for Parents After a Failed Newborn Hearing Screen[J].International Journal of Pediatric Otorhinolaryngology,2019,125:168-174.
[29]Raj S,Sharma V L,Singh A J,et al.Evaluation of Quality and Readability of Health Information Websites Identified Through Indias Major Search Engines[J].Advances in Preventive Medicine,2016:1-6.
[30]Risoldi C Z,Gregory P,Wilson A.Readability of Consumer Health Information on the Internet:A Comparison of U.S.Government-funded and Commercially Funded Websites[J].Journal of Health Communication,2012,17(9):1003-1010.
[31]Biddinika M K,Lestari R P,Indrawan B,et al.Measuring the Readability of Indonesian Biomass Websites:The Ease of Understanding Biomass Energy Information on Websites in the Indonesian Language[J].Renewable and Sustainable Energy Reviews,2016,59(2016):1349-1357.
[32]Biddinika M K,Indrawan B,Yoshikawa K,et al.Renewable Energy on the Internet:The Readability of Indonesian Biomass Websites[J].Energy Procedia,2014,61(2014):1376-1379.
[33]Ahmed O H,John Sullivan S,Schneiders A G,et al.Concussion Information Online:Evaluation of Information Quality,Content and Readability of Concussion-related Websites[J].British Journal of Sports Medicine,2012,46(9):675-683.
[34]Chi E,Jabbour N,Aaronson N L.Quality and Readability of Websites for Patient Information on Tonsillectomy and Sleep Apnea[J].International Journal of Pediatric Otorhinolaryngology,2017,98:1-3.
[35]Lam C G,Roter D L,Cohen K J.Survey of Quality,Readability,and Social Reach of Websites on Osteosarcoma in Adolescents[J].Patient Education and Counseling,2013,90(1):82-87.
[36]Yang S.A Readability Formula for Chinese Language[D].Wisconsin:University of Wisconsin,1970.
[37]孫汉银.中文易懂性公式[D].北京:北京师范大学,1992.
[38]荆溪昱.中文国文教材的适读性研究:适读年级值的推估[J].教育研究资讯,1995,(5):113-127.
[39]郭望皓.对外汉语文本易读性公式研究[D].上海:上海交通大学,2010. [40]李萍.我国上市公司年报中“管理层讨论与分析”的可读性分析[J].时代金融,2018,(9):225-226.
[41]中国政府网.中华人民共和国食品安全法实施条例[EB/OL].http://www.gov.cn/zhengce/content/2019-10/31/content_5447142.htm,2020-01-05.
[42]中国政府网.中共中央、国务院印发《“健康中国2030”规划纲要》[EB/OL].http://www.gov.cn/xinwen/2016-10/25/content_5124174.htm,2020-01-05.
[43]闫国利,张巧明,白学军.中文阅读知觉广度的影响因素研究[J].心理发展与教育,2013,29(2):121-130.
[44]Rayner K.Eye Movements and the Perceptual Span in Beginning and Skilled Readers[J].Journal of Experimental Child Psychology,1986,41:211-236.
[45]Henderson J M,Ferreira F.Effects of Foveal Processing Difficulty on the Perceptual Span in Reading:Implications for Attention and Eye Movement Control[J].Journal of Experimental Psychology:Learning,Memory,and Cognition,1990,16:417-429.
[46]Laplante-Lévesque A,Brnnstrm K J,Andersson G,et al.Quality and Readability of English-language Internet Information for Adults with Hearing Impairment and Their Significant Others[J].International Journal of Audiology,2012,51(8):618-626.
[47]Farrant K,Heazell A E P.Online Information for Women and Their Families Regarding Reduced Fetal Movements is of Variable Quality,Readability and Accountability[J].Midwifery,2016,34:72-78.
[48]Alsoghier A,Ni Riordain R,Fedele S,et al.Web-based Information on Oral Dysplasia and Precancer of the Mouth-Quality and Readability[J].Oral Oncology,2018,82:69-74.
[49]Clarke C L A,Agichtein E,Dumais S,et al.The Influence of Caption Features on Clickthrough Patterns in Web Search[C]//Proceedings of the 30th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval,2007:135-142.
[50]Duarte Torres S,Weber I,Hiemstra D.Analysis of Search and Browsing Behavior of Young Users on the Web[C]//ACM Transactions on the Web,2014,8(2):7.
(責任编辑:郭沫含)
关键词:可读性计算;在线健康信息;健康教育材料;食品安全
DOI:10.3969/j.issn.1008-0821.2020.05.014
〔中图分类号〕G252 〔文献标识码〕A 〔文章编号〕1008-0821(2020)05-0111-11
An Empirical Study on Readability Calculation and Application of
Chinese Online Health Education Information
——A Case Study of Food Safety
Qin Qin Ke Qing Ding Songyun
(School of Information Management,Nanjing University,Nanjing 210023,China)
Abstract:[Purpose/Significance]The readability level of health websites information directly affects the publics cognitive process of health information,thus affecting users health-related decisions and the development of the website.[Method/Process]The readability calculation formula of Chinese health information online was constructed by reviewing the principles of readability calculation methods at home and abroad.Health education materials of food safety in Chinese health education Network were selected for readability calculation and evaluation.The readability of Chinese food safety health information online was analyzed from time,characters of source websites and views.[Result/Conclusion]The readability of Chinese health education information online was low but becoming better in recent years,there were differences in the readability of health information between different characters of websites,information on government websites was the most readable,followed by comprehensive network media,and information on professional network media was the least readable,the views of materials was negatively related to the readability value of material titles,and the proportion of medical terms negatively affected the views of materials significantly.
Key words:readability calculation;health information online;health education materials;food safety
健康信息是指與人们身心健康相关的医学知识、保健知识、健康服务等,健康教育材料是健康教育传播活动中健康信息的载体[1-2]。生态环境恶化问题的加剧不断威胁人类生存条件和身体健康,公众对于健康信息和健康服务的需求也更加多样化和实时性,越来越多的人不满足于通过传统的实体渠道向医生和医疗机构寻求健康咨询和治疗指导,而是主动、积极地从互联网上搜寻获取健康相关信息。因而互联网上提供的各种以健康教育为目的的健康材料成为人们了解疾病知识、掌握药物信息、寻求治疗方式的重要信息源。在这种背景下,健康教育材料的可读性成为影响健康信息加工认知效率的重要因素。可读性也称易读性(Readability),Dale E等[3]将其定义为“文本材料所包含的影响读者有效使用的所有要素及其之间相互作用的总和”。健康网站教育材料可读性的强弱影响用户对健康信息的理解程度以及所作健康决策的合理性,对在线健康信息可读性进行评价一方面可以帮助健康信息用户选择适合自己阅读水平的阅读材料,从而更加便捷、有效地浏览健康信息并作出健康决策;另一方面可以帮助健康网站建设者更清晰地认识网站定位,完善网站建设。本文构建面向中文健康信息的可读性计算公式,并选取中国健康教育网站中食品安全在线健康教育材料进行可读性实证评价,从年份、来源网站性质和阅读次数3个方面分析食品安全在线健康信息可读性,并针对各指标提出可读性改善措施。 1 在线健康信息可读性相关研究
1.1 在线健康信息可读性
国外学者对于在线健康信息可读性的研究大致分为两类:第一,对健康信息可讀性计算公式进行梳理的综述研究[4-5];第二,利用可读性计算公式对在线健康信息可读性水平进行评估的应用研究,包括对保健类[6]和疾病类[7-8]医疗健康信息可读性的研究,对政府机构[9]、非营利性组织[10]和商业健康网站[11]可读性的研究,以及对不同语种健康信息可读性[12]的研究。一些学者在计算可读性的同时还对在线健康信息的内容[13]、质量[13-15]和准确性[14-16]进行评价。国外关于在线健康信息可读性的研究主要考虑客观文本因素,对客观非文本因素和主观因素的研究鲜见。采用可读性计算公式评估方式虽然能够简单、快速地量化文本的可读性,但忽视了健康信息用户的经验、动机等主观因素以及网站界面设计、网站交互性等客观非文本因素的影响。为完善对非文本因素影响的评估,一些学者还开发了属性清单[17]和等级量表[18]等辅助评估工具对可读性计算方法进行改善。
国内学者对于可读性的研究主要包括对可读性公式的探讨和对教材、文学作品、新闻报刊等文本可读性的定性研究、理论研究,针对健康信息可读性的实证研究,尤其是利用可读性评测工具对在线健康信息可读性进行评价的实证研究十分少见。苟梦野等[19]利用总字数、平均句长、甲级词比、乙级词比、丙级词比、丁级词比、医学主题词比、情感词极性值8个指标对糖尿病和乳腺增生病健康网站可读性进行综合评分。
1.2 可读性计算公式
国外常用的可读性计算公式主要包括SMOG[20]、Fog[21]、Flesch Reading Ease(FRE)[22]、Flesch-Kincaid(F-K)[23]、Fry[24],其中FRE和F-K公式在国外学者的健康信息可读性研究中应用最普遍,而SMOG公式因其容易理解和便于使用的特点更适用于医疗健康领域可读性的研究[25]。梳理国外常用可读性计算公式指标含义、评价标准、评价水平、优缺点和应用,见表1。
国内关于可读性的研究起步较晚,发展较缓慢,利用计算公式对文本进行可读性计算和评估的研究较少,选择Yang S[36]、孙汉银[37]、荆溪昱[38]、郭望皓[39]和李萍[40]提出的计算公式作为国内代表性可读性计算公式。梳理各可读性计算公式指标含义、评价标准、评价水平和优缺点,见表2。
国外的可读性计算公式有相对应的评价标准,能够将可读性计算结果与阅读水平对照得出阅读材料适合的年级阅读水平,但公式仅仅将句子长度、文本长度和单词音节数作为可读性衡量标准,而忽视了各行业领域专业词汇对于可读性的重要影响。国内的可读性计算公式对于常用字/词和不常用字/词的划分标准不统一、主观性较强,而专业术语作为衡量标准的引入为改善可读性计算公式提供了新思路。鉴于中文阅读分级标准目前尚未统一以及缺乏将中文文本可读性数值和公众阅读水平标准进行对应研究的现状,难以判断不同的阅读材料可读性对应的阅读等级。
2 中文健康信息可读性计算公式的构建
在现有的中文可读性计算公式中,中国台湾地区学者荆溪昱提出的公式最为权威,他对台湾小学和中学共12个年级的中文教材进行分析,将每个学期作为一个可读性级别,选取3个变量制定可读性计算公式:
其中,R表示可读性值;X1表示不含标点符号的文章总字数;X2表示文章平均句长,即文章总字数与文章完全句数之比,完全句是指以句号、问号和感叹号结束的句子;X3表示常用字所占比例,常用字参照表为台湾国小495常用繁体字表[38]。荆溪昱提出的中文可读性计算公式效度高达0.8486[38],可推广用于一般教育材料可读性的计算。针对健康信息可读性的计算,式(1)中X1和X2指标值容易获取,而X3指标中常用字的划分标准显然不适用于健康教育材料简体中文常用字的划分。
李萍针对式(1)中的X3指标进行调整,选取篇长、平均句长和会计专业术语所占比例3个指标作为上市公司年报可读性的衡量指标,在荆溪昱公式基础上加以创新得到上市公司年报可读性计算公式:
其中,X1表示文章总字数,X2表示文章平均句长(句均字数),X3′表示会计专业术语所占比例(会计专业术语个数/总字数)[40]。式(2)仅仅对式(1)中的X3指标进行调整,将专业术语作为衡量指标引入可读性计算公式,解决了荆溪昱公式中常用字的划分标准无法推广使用的问题。另外,这一调整将常用字/词统计工作转变为非常用字/词统计工作,大大减少了工作量。遗憾的是,式(2)中的X3′指标对于字数和词数的概念模糊不清,用专业术语词数除以文章总字数得到专业术语占比,该方法的合理性有待商榷。
本研究以荆溪昱公式为基础,借鉴李萍的创新方法并加以改进,构建面向中文健康信息的可读性计算公式:
R=17.5255 0.0024×总字数 0.04415×平均句长-18.3344×(1-医学专业术语占比)(3)
式(3)中,R值代表健康信息的可读性水平,R值越小,可读性越强,健康教育材料越容易阅读。总字数=不含标点符号的材料总字数,平均句长=材料总字数/完全句数,医学专业术语占比=医学专业术语字数/总字数。式(3)仅对公式1中的X3指标进行调整,各个指标的系数参照式(1)。本研究以食品安全教育材料为例计算在线健康信息可读性,食品安全健康信息属于医疗健康信息,对食品安全健康教育材料中的医学专业术语进行统计使统计结果更加全面、完整。
3 材料与方法
3.1 文本材料 本文选择的在线健康教育信息可读性评价实证对象为中国健康教育网(http://www.nihe.org.cn/),它是一个集健康教育材料、健康新闻、健康知识科普、各省健康教育工作动态以及专业指导信息于一体的综合性网站。中国健康教育中心是国家卫生和计划生育委员会直属事业单位,中国健康教育网是中国健康教育中心的官方网站,囊括了很多其它政府门户网站和商业健康网站的健康教育材料,发布的食品安全在线健康教育信息具有一定的代表性和权威性。本研究选取了中国健康教育网健康知识版块中的食品安全健康教育材料作为可读性评价文本,该类主题下的健康材料更新至2018年7月19日,选取2013年1月4日至2018年7月19日期间发布的212篇材料作为在线健康信息可读性计算数据来源。
3.2 食品安全在线健康信息可读性计算方法
根据前文构造的式(3),对各指标的计算方法说明如下:
总字数和平均句长:在Word文档中统计各篇食品安全健康教育材料的总字数和总句数,用总字数除以总句数得到平均句长。
医学专业术语占比:医学专业术语确定的依据是LetPub网站上提供的医学健康类专业术语词典,LetPub专业医学英语词典集合了营养与食品卫生学、心理学、微生物专业医学、精神病学、内科、外科、儿科、妇产科等46个分类学科的医学专用词汇,囊括常用的医学专业术语词汇共16 229个。首先,采用Python中的Jieba分词组件对每篇食品安全健康教育材料进行分词,统计每篇材料的总词数;其次,选择LetPub专业医学英语词典作为医学专业术语词库,利用Excel的Vlookup功能将每篇材料的分词结果与LetPub专业医学词典进行对比,查找出每篇材料中的医学专业术语并统计字数;最后,用医学专业术语字数除以总字数得到每篇食品安全健康教育材料的医学专业术语占比。
4 食品安全在线健康信息可读性计算结果
4.1 可读性总体情况
计算212篇食品安全健康教育材料可读性值,结果如表3所示。由表3可知,食品安全健康教育材料之间总字数、平均句长、医学专业术语占比3个指标以及可读性值最大值和最小值悬殊,健康信息可读性差异较大。
由表4可知,可读性计算结果p值大于0.05,R值呈正态分布,具备良好的统计特征。利用柱形图展示212篇食品安全健康教育材料可读性值分布情况,结果如图1所示。
可读性值超过4的健康信息的能力才足以理解中国健康教育网上大部分食品安全健康教育材料的内容。为进一步了解国内食品安全在线健康教育信息可读性情况,从年份、来源网站性质和阅读次数3个方面分析中国健康教育网食品安全健康教育材料可读性值分布规律。
4.2 可读性年代分布特征
将健康教育材料按照年份统计,计算各年份材料总字数、平均句长、医学专业术语占比和可读性值的平均值和标准差,并利用折线图展示各年份可读性值及3个指标值的平均值变化情况,如图2所示。
由图2可知,随着时间推移,自2013年以来,食品安全健康信息可读性值均值整体呈波动式下降趋势,但变化幅度不大,反映健康信息可读性在缓慢增强,用户获取和采用健康信息的难度逐渐降低,其中尤以2016年发布的健康教育材料可读性最好(M=4.31)。根据标准差计算结果,各年份健康信息可读性之间的离散程度也具有一定的变化规律。2013年各篇材料可读性值差距较大(SD=1.96),此后差距逐渐缩小,并在2017年达到最小(SD=1.38),反映近年来健康信息来源媒体开始重视整体材料可读性的增强,呈现标准化的趋势。
折线图还反映了总字数、平均句长、医学专业术语占比3个分指标的变化情况。总字数反映了健康教育材料的篇幅,早期材料篇幅较大,自2014年开始逐渐降低,至2017年材料篇幅及各篇差异都缩减至最小(M=889.77,SD=417.81)。2018年平均总字数明显增加,是由于转载了《关于加大食品药品安全执法力度严格落实食品药品违法行为处罚到人的规定的通知》(食药监法[2018]12号),且该年份仅发布了9篇教育材料。平均句长反映了材料句子的简洁程度,2013-2018年,健康教育材料句長较稳定,简洁度无明显变化。专业术语占比反映了健康信息的医学专业程度,早期材料中医学专业术语较多,2014年开始呈波动性下降趋势,2018年医学专业术语占比降至最低(M=5.82%),表明健康网站开始缩减晦涩难懂的医学词汇,以简单易懂的表达方式向公众传达健康信息。
此外,观察3个分指标值和可读性值的变化趋势可以看出,医学专业术语占比下降幅度最大。结合式(3)中各指标值权重系数可知,医学专业术语占比降低是促使健康信息可读性增强最重要的原因。因此,食品安全健康教育材料中包含的医学专业术语逐渐减少,为健康信息可读性逐渐增强贡献了主要力量。
4.3 可读性网站性质分布特征
研究选取的食品安全健康教育材料来源于9个网站,将这些来源网站按其性质分为政府机构网站、综合性网络媒体和专业性网络媒体,计算不同性质网站食品安全健康教育材料总字数、平均句长、医学专业术语占比和可读性值的平均值和标准差,结果如表5所示。
由表5可知,政府机构网站健康教育材料可读性值平均值和标准差最小,表明政府机构网站健康教育材料可读性最强,且各篇材料之间可读性相差最小,专业性网络媒体健康教育材料可读性值平均值最大,可读性最弱。综合性网络媒体可读性值介于两者之间。根据3种性质网站各指标统计结果可知,政府机构网站材料的平均篇幅最小、医学专业性最弱且各篇材料相差最小;综合性网络媒体材料平均篇幅最大、句子最简洁但各篇材料相差最大;专业性网络媒体材料句子最冗长、医学专业性最强且各篇材料相差最大。
通过对3种性质网站健康教育材料可读性值进行单因素方差分析判断不同性质网站教育材料总体可读性值是否存在差异。上文中已对212篇食品安全健康教育材料可读性值进行正态性检验,结果显示可读性值服从正态分布。将3个网站性质作为因子对212个可读性值进行单因素ANOVA检验,得到方差齐性检验结果和ANOVA检验结果,如表6和表7所示。 由表6可知,当前自由度下的p值大于0.05,样本所来自的总体满足方差齐性要求。由表7可知,ANOVA检验统计量F为11.443,p值小于0.01,因此3个不同性质网站的食品安全健康教育材料总体可读性值均值存在差异,政府机构网站、综合性网络媒体、专业性网络媒体食品安全健康教育材料可读性值均值依次递增,即政府机构网站在线健康信息可读性最强,综合性网络媒体次之,专业性网络媒体在线健康信息可读性最弱。
4.4 可读性与阅读次数之间的关系
阅读次数体现健康信息的传播力,利用散点图展示212篇健康教育材料可读性值与阅读次数之间的关系,如图3所示。
由图3可知,健康教育材料阅读次数与可读性值之间并未呈线性趋势分布,拟合线也呈水平状,表明健康教育材料的文章内容与阅读次数之间不存在线性相关关系。
中国健康教育网对于每篇健康教育材料阅读次数的计数方法为:用户点击1次健康教育材料标题,页面成功跳转至材料内容,则视为1次阅读。因此笔者猜想,健康教育材料的阅读次数可能与每篇材料标题的可读性有关。为验证猜想,对212篇食品安全健康教育材料标题可读性进行计算,将标题的平均句长视为标题字数,则根据式(3)可得健康教育材料标题可读性计算公式:
计算212篇食品安全健康教育材料标题可读性值,利用散点图展示标题可读性值与阅读次数之间的关系,如图4所示。
由图4可知,健康教育材料阅读次数与材料标题可读性值之间关联呈线性趋势,两者存在线性相关关系。对健康教育材料阅读次数与材料标题可读性值进行相关分析,结果如表8所示。
7所示。企业招聘与培训要求与本模型理论假设基本一致,理论模型符合实际需求,可作为竞争情报人员选拔与培训的参考依据。
由表8可知,健康教育材料阅读次数与材料标题可读性值相关系数为-0.454,对相关系数的检验的双侧p值小于0.001。因此,健康教育材料阅读次数与材料标题可读性值呈负相关关系,即健康教育材料标题的可读性值越小、标题可读性越强时,材料内容的阅读次数越多。基于材料标题可读性值与材料阅读次数的线性相关关系,进一步分析标题字数、标题医学专业术语占比2个分指标与阅读次数之间的关系。将标题字数和标题医学专业术语占比作为自变量,阅读次数作为因变量,对三者进行回归分析,结果如表9和表10所示。
由表9可知,方差分析结果p值小于0.05,检验拟合的两个模型具有统计意义。根据表10的回归系数结果,发现标题字数p值大于0.05,因此剔除标题字数变量,得到回归方程:阅读次数=4725.943-14015.018×标题医学专业术语占比。回归分析结果表明,在用于计算健康教育材料标题可读性值的两个指标中,只有标题医学专业术语占比对材料的阅读次数存在显著负向影响,标题字数对阅读次数不存在显著相关性。
5 讨 论
5.1 中文食品安全在线健康信息可读性现状及存在问题
2013-2018年,中文食品安全健康信息可读性整体呈增强趋势,这一趋势主要得益于医学专业词汇的减少。健康教育材料之间的可读性差距也随年份地推移逐渐变小,教育材料对公众阅读水平的要求渐趋宽松,用户获取健康信息越来越便捷有效,有利于用户更加轻松地做出正确的健康决策。根据2019年3月修订的《中华人民共和国食品安全法实施条例》[41],国家已将食品安全知识纳入国民素质教育内容,旨在普及食品安全常识,提高全社会的食品安全意识。食品安全健康信息可读性的增强有利于公众理解健康信息,获取健康知识,为建立健全健康促进与教育体系,提高健康教育服务能力[42],从而提高全民健康素养,推进健康中国建设贡献力量。然而,通过分析研究选取的健康教育材料可读性值及3个分指标值,发现中文食品安全在线健康信息还存在以下问题:
第一,信息容量较大,句子较长。平均每篇健康教育材料字数超过1 000字,平均每句话超过40字,教育材料篇幅过长、语句切分不恰当容易造成用户阅读疲劳、逻辑混乱,导致用户难以有效获取健康信息。
第二,医学词汇较多,专业性较强。超3成食品安全健康教育材料含有10%以上的医学词汇,医学专业性较强的材料更为权威、科学,但往往给用户尤其是医学知识薄弱的用户造成理解上的困难。因此,怎样以简单易懂的方式向公众准确地传达科学的健康信息成为健康网站面临的主要挑战。
第三,教育材料之间难易程度悬殊,篇幅、句长、医学专业词汇含量都存在较大差异。其中,总字数标准差高达698,医学专业术语占比平均值为8.52%,标准差高达5.02%。闫国利等[43]研究发现,不同难度的阅读材料会影响人们的知觉广度,进而影响阅读速度和阅读效率。阅读难材料会导致认知加工负荷增大,阅读效率降低。这一研究结果与Rayner K[44]、Henderson J M等[45]对英文阅读材料的研究结果一致。因此,教育材料阅读难度差距过大不利于用户提高整体阅读效率,快速获取有效信息。
总之,中文食品安全健康信息整体可读性不高且参差不齐,健康信息用户需要具备一定程度的阅读水平,并具有一定的医学知识储备才能较好地理解健康信息,满足自身健康信息需求。
5.2 可读性与网站性质的关系
通过对来源于不同性质网站的食品安全健康教育材料样本可读性值均值进行方差分析,发现其总体均值存在差异,其中政府机构网站健康信息可读性最强,综合性网络媒体次之,专业性网络媒体健康信息可读性最弱。
政府机构网站是政务公开和政民互动的主要载体和渠道,发布的健康信息受众较广,信息接收方医学专业素养整体不高。因此,政府网站健康教育材料具备权威、惠民的特点,尤其是涉及公众食品安全这一重大民生问题,政府机构网站在线健康信息更加真实可靠,可读性、实用性更强。Risoldi C Z等[11]利用SMOG、FRE、F-K 3個公式分别对政府网站和商业网站发布的健康信息可读性进行计算,综合3个公式的计算结果发现政府网站健康信息的可读性较强。Laplante-Lévesque A等[46]分别对商业网站、非营利组织网站和政府网站发布的听力障碍相关健康信息可读性进行研究,发现三者之中政府网站健康信息可读性最强。综合性网络媒体作为国内主流媒体网站,在竞争领域中占据较大的市场份额,在社会发展中担当较大的社会责任。综合性网络媒体通过获取公众认可、赢得公众信任获取公信力,发布的健康信息在注重可读性的同时还要兼顾信息内容的专业性。专业性网络媒体提供的健康信息以健康行业资讯和医学专业知识为主,该类网站用户具备较强的医学知识,对健康信息专业性要求较高。因此,市场导向下的专业性网络媒体提供的健康信息服务最具专业性价值、最完善,发布的健康信息包含大量医学专业术语,可读性也最弱。Koo K等[7]对57个专业医学网站发布的膀胱过动症相关健康信息可读性进行分析,发现88%的在线健康信息都超出了大多数成年人的阅读能力。 5.3 可讀性对阅读次数的影响
通过对食品安全健康教育材料可读性值与材料阅读次数相关性进行分析,发现材料阅读次数与材料内容的可读性值并不存在相关趋势。这一研究结论与Farrant K等[47]、Alsoghier A等[48]学者的观点一致,他们分别对胎动和口腔疾病的网站健康信息可读性值进行计算,发现网站访问次数与网站健康信息可读性、信息浏览次数与信息可读性之间均不相关。
通过分析健康教育材料标题可读性值与材料阅读次数,发现两者呈线性负相关,利用回归分析发现标题可读性值的分指标标题医学专业术语占比与材料阅读次数显著负相关,回归系数为-14 015.018。标题是健康信息内容最简练、最集中的表现形式,承担着概括主旨、吸引读者等要务,可读性强的标题会吸引用户点击和浏览健康信息内容,从而帮助用户获取信息、提高信息的传播能力。Clarke C L A等[49]学者通过研究网络搜索中网页的文字特征对网页点击率的影响,发现网页标题的可读性是影响用户浏览行为的重要因素,标题可读性强的网页点击率更高。Duarte Torres S等[50]特别地对未成年网络用户的信息浏览行为进行研究,发现网页信息标题的可读性对儿童和青少年网络用户群体的网页浏览量都存在显著的正向影响,并且对儿童的浏览行为影响更大。
6 结 论
本文对国内外可读性计算公式进行梳理和辨析,根据健康信息特点,在权威公式的基础上构建面向中文健康信息的可读性计算公式。利用公式对中国健康教育网食品安全在线健康教育材料可读性进行计算,发现中文食品安全健康信息整体可读性不高,信息容量较大,句子较长;医学词汇较多,专业性较强;教育材料之间难易程度悬殊,篇幅、句长、医学专业词汇含量都存在较大差异。从年份、来源网站性质和阅读次数3个方面分析健康信息可读性,发现近年来可读性呈增强趋势;在不同性质的来源网站中,政府机构网站健康信息可读性最强,综合性网络媒体次之,专业性网络媒体健康信息可读性最弱;在线健康教育材料阅读次数与材料内容可读性值不相关而与材料标题可读性值负相关,其中材料标题医学专业术语占比显著负向影响材料阅读次数。研究的局限性在于,目前国内缺乏与可读性计算公式对应的中文阅读水平分级标准,因此只能对在线健康信息可读性值本身进行评价和分析,这也是中文文本可读性研究亟需解决的问题。
参考文献
[1]Elliott B J,Polkinhorn J S.Provision of Consumer Health Information in General Practice[J].British Medical Journal,1994,308(6927):509-510.
[2]田本淳,董蕾.平面健康教育材料设计制作使用与评价[M].北京:北京大学医学出版社,2011.
[3]Dale E,Chall J S.The Concept of Readability[J].Elementary English,1949,26(1):19-26.
[4]Beaunoyer E,Arsenault M,Lomanowska A M,et al.Understanding Online Health Information:Evaluation,Tools,and Strategies[J].Patient Education and Counseling,2017,100(2):183-189.
[5]Daraz L,Morrow A S,Ponce O J,et al.Readability of Online Health Information:A Meta-Narrative Systematic Review[J].American Journal of Medical Quality,2018,33(5):487-492.
[6]Skierkowski D D,Florin P,Harlow L L,et al.A Readability Analysis of Online Mental Health Resources[J].American Psychologist,2019,74(4):474-483.
[7]Koo K,Shee K,Yap R L.Readability Analysis of Online Health Information About Overactive Bladder[J].Neurourology and Urodynamics,2017,36(7):1782-1787.
[8]Wong K,Levi J R.Partial Tonsillectomy:Content and Readability of Online Health Information[J].Annals of Otology,Rhinology and Laryngology,2017,126(3):192-198.
[9]Tulsieram K L,Arocha J F,Lee J.Readability and Coherence of Department/Ministry of Health HPV Information[J].Journal of Cancer Education,2018,33(1):147-153.
[10]Walsh T M,Volsko T A.Readability Assessment of Internet-based Consumer Health Information[J].Respiratory Care,2008,53(10):1310-1315. [11]Risoldi C Z,Gregory P,Wilson A.Readability of Consumer Health Information on the Internet:A Comparison of U.S.Government-funded and Commercially Funded Websites[J].Journal of Health Communication,2012,17(9):1003-1010.
[12]Berland G K,Elliott M N,Morales L S,et al.Health Information on the Internet:Accessibility,Quality,and Readability in English and Spanish[J].Journal of the American Medical Association,2001,285(20):2612-2621.
[13]Patton L L,George S F,Hollowell R P.Content,Quality,and Readability of Website Information on Dental Care for Cancer Patients[J].Oral Surgery,Oral Medicine,Oral Pathology and Oral Radiology,2014,118(1):78-83.
[14]Garfinkle R,Wong-Chong N,Petrucci A,et al.Assessing the Readability,Quality and Accuracy of Online Health Information for Patients with Low Anterior Resection Syndrome Following Surgery for Rectal Cancer[J].Colorectal Disease,2019,21(5):523-531.
[15]Cisu T I,Mingin G C,Baskin L S.An Evaluation of the Readability,Quality,and Accuracy of Online Health Information Regarding the Treatment of Hypospadias[J].Journal of Pediatric Urology,2019,15(1):40.e1-40.e6.
[16]Storino A,Castillo-Angeles M,Watkins A A,et al.Assessing the Accuracy and Readability of Online Health Information for Patients with Pancreatic Cancer[J].JAMA Surgery,2016,151(9):831-837.
[17]Strachan P H,De Laat S,Carroll S L,et al.Readability and Content of Patient Education Material Related to Implantable Cardioverter Defibrillators[J].Journal of Cardiovascular Nursing,2012,27(6):495-504.
[18]Shoemaker S J,Wolf M S,Brach C.Development of the Patient Education Materials Assessment Tool(PEMAT):A New Measure of Understandability and Actionability for Print and Audiovisual Patient Information[J].Patient Education and Counseling,2014,96(3):395-403.
[19]茍梦野,赵文龙,侯筱蓉,等.面向公众的网络健康信息可读性现状及对策探析——基于常见病症的定量研究[J].中国卫生事业管理,2019,36(2):157-160.
[20]McLaughlin G H.SMOG Grading:A New Readability Formula[J].J Read,1969,(12):639-646.
[21]Gunning R.The Technique of Clear Writing[M].New York:McGraw-Hill Book Company,1968.
[22]Flesch R F.A New Readability Yardstick[J].J Appl Psychol,1948,32:221-233.
[23]Kincaid J P,Fishburne R P,Rodgers R L,et al.Derivation of New Readability Formulas(Automated Readability Index,Fog Count and Flesch Reading Ease Formula)for Navy Enlisted Personnel[J].Springfield,IL:Naval Technical Training Command,1975,RBR-8-75.
[24]Fry E.A Readability Formula That Saves Time[J].J Reading,1968,(11):513-516,575-578. [25]Wang L W,Miller M J,Schmitt M R,et al.Assessing Readability Formula Differences with Written Health Information Materials:Application,Results,and Recommendations[J].2013,9(5):503-516.
[26]Crabbs L M,McCall W A.Standard Test Lessons in Reading[J].Teachers College Record,1925,27(3):183-183.
[27]Hansberry D R,Patel S R,Agarwal P,et al.A Quantitative Readability Analysis of Patient Education Resources from Gastroenterology Society Websites[J].International Journal of Colorectal Disease,2017,32(6):917-920.
[28]Sax L,Razak A,Shetty K,et al.Readability of Online Patient Education Materials for Parents After a Failed Newborn Hearing Screen[J].International Journal of Pediatric Otorhinolaryngology,2019,125:168-174.
[29]Raj S,Sharma V L,Singh A J,et al.Evaluation of Quality and Readability of Health Information Websites Identified Through Indias Major Search Engines[J].Advances in Preventive Medicine,2016:1-6.
[30]Risoldi C Z,Gregory P,Wilson A.Readability of Consumer Health Information on the Internet:A Comparison of U.S.Government-funded and Commercially Funded Websites[J].Journal of Health Communication,2012,17(9):1003-1010.
[31]Biddinika M K,Lestari R P,Indrawan B,et al.Measuring the Readability of Indonesian Biomass Websites:The Ease of Understanding Biomass Energy Information on Websites in the Indonesian Language[J].Renewable and Sustainable Energy Reviews,2016,59(2016):1349-1357.
[32]Biddinika M K,Indrawan B,Yoshikawa K,et al.Renewable Energy on the Internet:The Readability of Indonesian Biomass Websites[J].Energy Procedia,2014,61(2014):1376-1379.
[33]Ahmed O H,John Sullivan S,Schneiders A G,et al.Concussion Information Online:Evaluation of Information Quality,Content and Readability of Concussion-related Websites[J].British Journal of Sports Medicine,2012,46(9):675-683.
[34]Chi E,Jabbour N,Aaronson N L.Quality and Readability of Websites for Patient Information on Tonsillectomy and Sleep Apnea[J].International Journal of Pediatric Otorhinolaryngology,2017,98:1-3.
[35]Lam C G,Roter D L,Cohen K J.Survey of Quality,Readability,and Social Reach of Websites on Osteosarcoma in Adolescents[J].Patient Education and Counseling,2013,90(1):82-87.
[36]Yang S.A Readability Formula for Chinese Language[D].Wisconsin:University of Wisconsin,1970.
[37]孫汉银.中文易懂性公式[D].北京:北京师范大学,1992.
[38]荆溪昱.中文国文教材的适读性研究:适读年级值的推估[J].教育研究资讯,1995,(5):113-127.
[39]郭望皓.对外汉语文本易读性公式研究[D].上海:上海交通大学,2010. [40]李萍.我国上市公司年报中“管理层讨论与分析”的可读性分析[J].时代金融,2018,(9):225-226.
[41]中国政府网.中华人民共和国食品安全法实施条例[EB/OL].http://www.gov.cn/zhengce/content/2019-10/31/content_5447142.htm,2020-01-05.
[42]中国政府网.中共中央、国务院印发《“健康中国2030”规划纲要》[EB/OL].http://www.gov.cn/xinwen/2016-10/25/content_5124174.htm,2020-01-05.
[43]闫国利,张巧明,白学军.中文阅读知觉广度的影响因素研究[J].心理发展与教育,2013,29(2):121-130.
[44]Rayner K.Eye Movements and the Perceptual Span in Beginning and Skilled Readers[J].Journal of Experimental Child Psychology,1986,41:211-236.
[45]Henderson J M,Ferreira F.Effects of Foveal Processing Difficulty on the Perceptual Span in Reading:Implications for Attention and Eye Movement Control[J].Journal of Experimental Psychology:Learning,Memory,and Cognition,1990,16:417-429.
[46]Laplante-Lévesque A,Brnnstrm K J,Andersson G,et al.Quality and Readability of English-language Internet Information for Adults with Hearing Impairment and Their Significant Others[J].International Journal of Audiology,2012,51(8):618-626.
[47]Farrant K,Heazell A E P.Online Information for Women and Their Families Regarding Reduced Fetal Movements is of Variable Quality,Readability and Accountability[J].Midwifery,2016,34:72-78.
[48]Alsoghier A,Ni Riordain R,Fedele S,et al.Web-based Information on Oral Dysplasia and Precancer of the Mouth-Quality and Readability[J].Oral Oncology,2018,82:69-74.
[49]Clarke C L A,Agichtein E,Dumais S,et al.The Influence of Caption Features on Clickthrough Patterns in Web Search[C]//Proceedings of the 30th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval,2007:135-142.
[50]Duarte Torres S,Weber I,Hiemstra D.Analysis of Search and Browsing Behavior of Young Users on the Web[C]//ACM Transactions on the Web,2014,8(2):7.
(責任编辑:郭沫含)