健康信息学的学科范畴、范式框架与关联路径研究

健康信息学的学科范畴、范式框架与关联路径研究

王若佳 李世娟 翟兴

 

健康信息学是否有规范的研究范式?

所谓研究范式,是指描述常规科学内部进行集体性知识创造时被一个学术共同体奉为标准的一系列普遍性规则、方法、概念及理论。早在20世纪90年代,学界就开始了对健康信息学的研究,至今已取得了丰硕的研究成果,然而由于学科的特殊性,总体来说目前的研究仍较为分散,还未形成体系。健康信息学的研究范式是健康信息学领域中的研究者所共有的基本世界观,决定了该领域“研究什么”以及“怎么研究”。对研究范式进行归纳阐述,有助于明确学科体系结构,促进学科进一步发展,对改进医疗卫生服务、促进全球人民健康亦具有重要意义。

我们通过对已有文献的梳理,从定量和定性两个角度,对健康信息学的学科范畴和研究范式进行总结,通过对不同研究范式在研究内容、数据来源、研究方法和理论基础四部分的剖析,解释健康信息学的研究内涵,并基于知识图谱技术构建健康信息学相关知识体系的关联路径,以期为相关学者从事该方向研究提供理论和方法上的指导。

 

—健康信息学的研究范式是健康信息学领域中的研究者所共有的基本世界观,决定了该领域“研究什么”以及“怎么研究”。—


健康信息学科范畴和范式框架是什么?

通过对健康信息学论文的学科交叉现状和研究主题进行计量分析,从定量角度探究健康信息学的学科范畴。结果显示,健康信息学是一个典型的交叉学科,具有学科覆盖面广、交叉性强的特征。图1为健康信息学领域的学科覆盖图,图中的节点代表学科类别、节点之间的边表示被相同论文引用、节点颜色为该学科所属的学科大类。可以看到,高频引用学科以信息科学、医学健康、计算机科学为主,还涉及到数学、生物学、生物化学、社会科学、工程学、心理学等学科大类。

图 1  健康信息学领域的学科覆盖图

然后,采用内容分析法从研究内容、数据来源、研究方法和理论基础4个角度进行开放性编码与归纳,从定性角度构建该学科的范式框架(如图2),归纳总结了人工智能算法应用、人机交互系统应用、信息技术对患者健康影响、用户与信息行为、信息与知识服务、信息存储与组织、文献与信息计量、信息检索与系统八种常见的健康信息学研究内容。

图 2  健康信息学基本研究范式框架

 

健康信息学研究的关联路径有哪些?

为了帮助相关科研人员方便、快速地厘清健康信息学学科知识关联的脉络,采用Neo4j图数据库构建了健康信息学各体系要素间的关联路径知识图谱。该知识图谱的逻辑本体层如图3所示,包括科研论文、所属学科、研究内容等9个实体,以及论文所属学科、论文关键词、论文研究内容等9个关系。

图 3  关联路径知识图谱的逻辑本体层

我们将已构建的知识图谱应用于多维度语义搜索和论文智能推荐2个常见科研服务场景中,验证了本研究在学科服务中的应用价值。例如,图4展示了科研人员查询“用户与信息行为”领域常见研究方法时的可视化检索结果,该图中深绿色节点为研究方法类别,浅绿色节点为具体的方法名称,用户可通过点选具体的方法名称查看有哪些论文(粉色节点)使用了该方法进行研究。可以看出,用户与信息行为相关研究主要采用统计方法进行数据分析,常用的统计方法包括描述性统计、卡方检验、方差分析、逻辑回归、多元线性回归等。

图 4  用户与信息行为领域常见研究方法的可视化检索结果

健康信息学是在情报学的基础上,基于临床医学的基本研究内容,又大量借鉴了计算机科学的相关技术而发展起来的一门新兴科学。为更好地厘清健康信息学研究与情报学研究之间的关系,本文从研究内容、数据来源、研究方法和理论基础四个方面对二者进行了对比。(1)在研究内容上,和健康信息学主要聚焦于用户与信息行为、信息与知识服务、信息存储与组织这三个主题相比,传统情报学的研究内容更为宽泛,既包括情报学基础研究、信息处理与分析、知识管理、竞争情报,也包括信息社会与信息事业管理、信息经济与信息产业、政府信息资源管理、数字图书馆等。此外,健康信息学还关注智能算法在医学健康中的应用,这与近年来情报学研究常使用新算法、新技术的趋势相吻合。不同之处在于,人机交互并不是传统情报学的研究热点,系统设计相关研究较少,但以用户为中心的系统评估可为情报学领域中用户行为、系统评估方向的学者提供合适的交叉点。(2)在数据来源上,情报学研究的数据来源以调研数据、文献数据和网络数据为主,而健康信息学因其相关学者多具有医学背景,或就职于医疗机构,或与医院有合作关系,因此真实的临床数据成为了主要数据来源。可见,情报学者若想走上健康信息学的研究方向,数据是一个不得不考虑的现实问题,多方合作或许是解决该问题的有效出路。(3)在研究方法上,情报学从一开始的以定性研究为主,逐渐发展到近年来越来越重视定量的研究方法,尤其是对计算机相关技术的吸纳与应用,与健康信息学论文多采用人工智能算法、自然语言处理等技术不谋而合。不同之处在于,卫生统计方法在健康信息学领域中比较常见,而在情报学中较少使用。(4)在理论基础上,情报学研究除借鉴认知心理学、经济学等常用理论外,还具有情报学自身特有的理论,例如布拉德福定律、洛特卡定律、组织理论、本体论、信息交换理论等。而健康信息学相关研究以应用研究为主,缺乏本领域特有的理论研究,这或许跟医学这个学科是一门典型的应用科学相关,但健康信息学今后若想发展为一门成熟的学科,缺乏理论基础的问题需要得到足够的重视与克服。

Read more Read more

Building Socio-technical resilience in software development: experiences from The Motivating Jenny Project (Fireside chat with Helen Sharp)

Building Socio-technical Resilience in Software Development: Experiences from The Motivating Jenny Project

A Fireside Chat with Helen Sharp

Shalini Urs

Software, software everywhere!

Software is everywhere and drives every part

Read more Read more

中国图情档预印本平台的建设与前瞻

中国图情档预印本平台的建设与前瞻

任娇菡1,2 王珏1,2 刘静羽1,2 初景利1,2

(1.中国科学院文献情报中心,北京,100190;

2.中国科学院大学经济与管理学院图书情报与档案管理系,北京,100190.)

1 引言

作者大多熟悉期刊出版,但往往对漫长的审稿和编辑过程感到困惑;读者大多希望能够在论文刚刚录用时就尽快阅读论文,但不得不等待期刊的统一发表。我们是否有什么解决方案可以同时满足两者的需求?答案就是预印本和预印本平台。

预印本是作者在提交期刊出版前未经严格同行评议的手稿、投稿版或录用稿,通常通过预印本平台在最短的时间内以开放获取的形式发布,为作者获得成果的网络首发权,为学术交流系统提供新的传播与利用渠道。预印本平台作为接收作者提交预印本论文手稿并为这些论文手稿提供开放交流服务的系统,已被列入中国科学院文献情报中心“十四五”规划主攻任务之一,旨在瞄准国际前沿,建设国家前沿领域学术论文预发布平台,提升中国在重要科技领域的话语权。

—与传统期刊相比,预印本在成果发布速度方面具有明显优势—

本文简单介绍中国最早按国际通行模式规范运营、最具综合性和影响力的预印本平台ChinaXiv,详细介绍其中的子平台“中国图情档预印本平台”的功能、发展情况。

2 中国预印本平台介绍

中国目前大约有15个各个学科、各种类型的预印本平台,其中最早按国际通行模式规范运营,最具综合性、影响力最大的平台是中国科学院科技论文预发布平台(ChinaXiv)(https://chinaxiv.org,界面如图1所示)。该平台于2016年6月正式上线,由中国科学院科学传播局支持、中国科学院文献情报中心建设,面向全国、全世界的科研人员开放。该平台作为中国科学院落实国家科研论文和科技信息高端交流平台建设任务的重要组成部分,作为开放科学时代开放获取、开放交流的重要表征,作为个人、期刊、机构、国家学术竞争力的重要体现,旨在缩短研究成果的发布周期,推动研究成果在第一时间最快速地发布与交流,着力于打造中国规范的学术交流生态系统;在竞争激烈的学术环境下,平台致力于支持中国高水平科研论文的快速预发布,有效保障中国科学家的科研首发权。

图1 ChinaXiv中文网页

中国科学院文献情报中心依托于图书情报与档案管理一级学科,打造的12种期刊在全国图情档业界学界具有重要的引领地位与示范作用。因此“十四五”期间,中心也在强力打造属于本学科的“中国图情档预印本平台”(http://lis.chinaxiv.org,界面如图2所示),希望借助平台的探索与发展,可以对其它领域的预印本平台建设起到一定的参考与借鉴作用,并期望通过以《图书情报工作》等期刊为首发布的预印本政策对全国图情档及各学科的期刊及机构起到先行先试的作用。

图2 中国图情档预印本平台中文网页

3 中国图情档预印本平台的功能

中国图情档预印本平台旨在打造“知识产权保护-开放评审-重复率检测-文字校对-稿件润色”全方位的服务体系,通过论文的快速存缴与公开发布,用户可免费获取最新研究成果,并保障作者首发权,促进图情档学科形成新型学术自治,推动交流与合作。为达成以上目标,中国图情档预印本平台开发了4个功能:

1)快速发布:与期刊相比,预印本在时间上具有绝对优势,其快速存缴与公开发布的能力一方面可保证研究的时效性,另一方面可以将学者的论文第一时间发布在公共平台中,帮助其保障理论思想或研究成果的首发权。论文发布时中国科学院邮箱用户无需注册,通过中国科学院邮箱可以直接访问并在线提交论文,其他用户需注册后采用单篇提交或邮箱提交的方式上传论文,通过审核后即可发布,可大幅提高文献被发现率和被引用率。发布流程如图3所示:

图3
Read more Read more