中国图情档预印本平台的建设与前瞻

中国图情档预印本平台的建设与前瞻

任娇菡1,2 王珏1,2 刘静羽1,2 初景利1,2

(1.中国科学院文献情报中心,北京,100190;

2.中国科学院大学经济与管理学院图书情报与档案管理系,北京,100190.)

1 引言

作者大多熟悉期刊出版,但往往对漫长的审稿和编辑过程感到困惑;读者大多希望能够在论文刚刚录用时就尽快阅读论文,但不得不等待期刊的统一发表。我们是否有什么解决方案可以同时满足两者的需求?答案就是预印本和预印本平台。

预印本是作者在提交期刊出版前未经严格同行评议的手稿、投稿版或录用稿,通常通过预印本平台在最短的时间内以开放获取的形式发布,为作者获得成果的网络首发权,为学术交流系统提供新的传播与利用渠道。预印本平台作为接收作者提交预印本论文手稿并为这些论文手稿提供开放交流服务的系统,已被列入中国科学院文献情报中心“十四五”规划主攻任务之一,旨在瞄准国际前沿,建设国家前沿领域学术论文预发布平台,提升中国在重要科技领域的话语权。

—与传统期刊相比,预印本在成果发布速度方面具有明显优势—

本文简单介绍中国最早按国际通行模式规范运营、最具综合性和影响力的预印本平台ChinaXiv,详细介绍其中的子平台“中国图情档预印本平台”的功能、发展情况。

2 中国预印本平台介绍

中国目前大约有15个各个学科、各种类型的预印本平台,其中最早按国际通行模式规范运营,最具综合性、影响力最大的平台是中国科学院科技论文预发布平台(ChinaXiv)(https://chinaxiv.org,界面如图1所示)。该平台于2016年6月正式上线,由中国科学院科学传播局支持、中国科学院文献情报中心建设,面向全国、全世界的科研人员开放。该平台作为中国科学院落实国家科研论文和科技信息高端交流平台建设任务的重要组成部分,作为开放科学时代开放获取、开放交流的重要表征,作为个人、期刊、机构、国家学术竞争力的重要体现,旨在缩短研究成果的发布周期,推动研究成果在第一时间最快速地发布与交流,着力于打造中国规范的学术交流生态系统;在竞争激烈的学术环境下,平台致力于支持中国高水平科研论文的快速预发布,有效保障中国科学家的科研首发权。

图1 ChinaXiv中文网页

中国科学院文献情报中心依托于图书情报与档案管理一级学科,打造的12种期刊在全国图情档业界学界具有重要的引领地位与示范作用。因此“十四五”期间,中心也在强力打造属于本学科的“中国图情档预印本平台”(http://lis.chinaxiv.org,界面如图2所示),希望借助平台的探索与发展,可以对其它领域的预印本平台建设起到一定的参考与借鉴作用,并期望通过以《图书情报工作》等期刊为首发布的预印本政策对全国图情档及各学科的期刊及机构起到先行先试的作用。

图2 中国图情档预印本平台中文网页

3 中国图情档预印本平台的功能

中国图情档预印本平台旨在打造“知识产权保护-开放评审-重复率检测-文字校对-稿件润色”全方位的服务体系,通过论文的快速存缴与公开发布,用户可免费获取最新研究成果,并保障作者首发权,促进图情档学科形成新型学术自治,推动交流与合作。为达成以上目标,中国图情档预印本平台开发了4个功能:

1)快速发布:与期刊相比,预印本在时间上具有绝对优势,其快速存缴与公开发布的能力一方面可保证研究的时效性,另一方面可以将学者的论文第一时间发布在公共平台中,帮助其保障理论思想或研究成果的首发权。论文发布时中国科学院邮箱用户无需注册,通过中国科学院邮箱可以直接访问并在线提交论文,其他用户需注册后采用单篇提交或邮箱提交的方式上传论文,通过审核后即可发布,可大幅提高文献被发现率和被引用率。发布流程如图3所示:

图3
Read more Read more

新冠疫情期间健康信息网络谣言的逆转模型

新冠疫情期间健康信息网络谣言的逆转模型

王晰巍

新冠疫情期间的谣言

新冠疫情深刻地改变了全球经济与社会,使得社会中的每个人、每个组织都进入了VUCA时代,即一个动荡(Volatility)、不确定(Uncertainty)、复杂(Complexity)和模糊(Ambiguity)的时代。互联网和社交媒体的发展扩大了信息传播的速度和范围,但在社交媒体上传播的有关新冠疫情的信息都是真实且可信的吗?发布的谣言会不会对网民和社会稳定产生负面影响?在全球新冠疫情盛行期间,由于互联网用户缺乏与健康有关的知识,导致了其对健康信息需求剧增,同时也极大地刺激了大众媒体对于健康信息的传播,但这也为造谣者提供了发布和传播健康信息的网络谣言的机会。如果无法及时对不实健康信息相关的网络谣言进行辟谣和控制,极易引发社会恐慌,影响社会公共秩序的同时也破坏了危机事件下的社会稳定。因此,如何对关于健康信息的网络谣言传播进行逆转及控制,是当前新冠肺炎疫情期间网络谣言治理及舆情引导的重要社会议题。

—逆转并控制关于健康信息的网络谣言的传播,是当前新冠肺炎疫情期间网络谣言治理及舆情引导的重要社会议题—

我们的研究主要考察了以下几方面的研究问题:(1)如何基于传统传染病的SIR模型,并结合科学知识水平理论构建G-SCNDR网络谣言逆转模型;(2)以新冠疫情期间的“双黄连事件”网络谣言为例,确定G-SCNDR网络谣言反转模型的传播规模和逆转路径;(3)对G-SCNDR网络谣言逆转模型中的参数进行敏感性分析,以确定相应措施,进而提高网络谣言逆转模型的效率。

谣言传播和逆转的模拟

研究在综合考虑健康信息网络谣言传播及逆转的内外部因素基础上,采纳科学知识水平理论对社交网络中的用户类型进行分类,确定健康信息网络谣言传播的具体策略,构建了网络谣言逆转模型G-SCNDR,对健康信息网络谣言的传播和逆转过程进行全局模拟,并对其传播及逆转的过程进行对比分析。

网络谣言逆转的G-SCNDR模型

研究提出的网络谣言逆转模型G-SCNDR,是以传统传染病SIR模型为基础,采纳了科学知识水平理论及“隔离-转换”策略进行构建的。根据模型的设计,研究将谣言逆转过程主要分为两个阶段,包括信息真空阶段(第一阶段)和信息披露阶段(第二阶段),官方节点采取外部控制策略之前为真空阶段,采取外部控制策略之后为信息披露阶段。在信息真空阶段,健康信息网络谣言在社交媒体中传播,在科学知识水平的影响下,系统中易感用户将分别转化为3种状态,分别是接触网络谣言后否认网络谣言的用户、相信网络谣言并传播谣言的用户C(t)、无法确定网络谣言的真实性保持中立并可能传播网络谣言的用户U(t)。

图1 网络谣言传播过程中用户状态转化图

图2 G-SCNDR网络谣言逆转过程中用户状态转化图

某一时刻t0,官方机构实施外部介入措施“隔离-转化”策略。官方机构找到部分有影响力的传播网络谣言的轻信节点及中立节点,人为的将这些用户转化为辟谣信息的用户,并对辟谣信息的微博进行转发,以证明发布辟谣信息的权威性及真实性,将此类人群命名为政府代言人节点G(t)。

此时系统中由于出现具有权威性的辟谣信息,中立节点和轻信节点自发开始转化为否认节点。同时,由于政府代言人节点的存在,易感节点出现两种转化为否定节点的方式。图1为网络谣言传播过程中用户的状态转化图,图2为网络谣言逆转过程中用户状态的转化图。

“隔离-转变”策略

研究从内部因素及外部因素角度出发,基于SIR模型采纳科学知识水平理论与外部网络谣言控制策略,构建了G-SCNDR网络谣言逆转模型,采用仿真分析方法对提出的G-SCNDR模型进行模拟,并对模型的重要参数进行敏感性分析,提出“隔离-转换”策略可以更好地控制网络谣言。研究发现,通过适当的采纳“隔离-转换”策略作为网络谣言外部控制的措施,提升用户科学知识水平的普及率,促进官方节点的转化效率,可以提升G-SCNDR网络谣言逆转模型的逆转效率。研究可以更好地帮助理解突发公共卫生事件背景下网络谣言的传播及网络谣言逆转过程,为突发公共卫生事件期间的网络谣言控制提供一定的指导和参考。

本文引用格式:Wang, X., Li, Y., Li, J., Liu,

Read more Read more

新冠肺炎疫情期间顾客对酒店服务的评价变化

新冠肺炎疫情期间顾客对酒店服务的评价变化

Feng Hu, Thorsten Teichert, Shengli Deng, Yong Liu, Guotao Zhou

下个月你有新的旅行计划吗?这场旅行可能处于与过去截然不同的情境中。你可能会因为担心安全而在旅途中再三考虑社交距离;在你的考虑中,露营计划正在取代豪华游轮计划;即将到来的旅程看起来将与疫情之前有大不同。众所周知,在新冠疫情爆发后旅行行为发生了改变。然而,我们对疫情如何改变游客对酒店服务的评价知之甚少。在严峻的疫情形势下,酒店服务需要关于事项优先性组织的实践指导,以适应消费者偏好可能出现的持续性变化。

—对安全的担心可能导致你在旅途中再三考虑社交距离—

本研究调查了在新冠肺炎疫情的不同阶段中,游客对酒店服务的期待及看法的变化。本研究收集了携程网的 98,163 条中国酒店的评价信息,进行了文本挖掘和情感分析,以获得酒店服务优化的新影响因素。

新冠疫情对上海酒店样本的入住率有何影响?

2020 年(黑线)和 2019 年(灰线)酒店入住率的对比表明,在首个时间节点(中国政府于 2020 年 1 月 21 日发布了关于新冠疫情的第一个公告)之后,中国酒店业开始受到新冠疫情的强烈影响。随之在第五个时间节点(2020 年 4 月

Read more Read more

从科学计量学的视角测量跨学科性

从科学计量学的视角测量跨学科性

步一

17世纪,René Descartes创造了解析几何,这是一个结合了代数和几何的全新领域。解析几何是数学领域最伟大的贡献之一,它将“数字”与“图形”联系形成一个整体。解析几何的创新性的建立是跨学科的典型案例,跨学科旨在解决仅靠单一学科无法解决的复杂问题,连接了多个学科的知识、理论、技能、工具、方法等。近年来,许多国家开始发布新的鼓励跨学科的政策。例如,我国国家自然科学基金委员会成立了第14个部门,即交叉科学部。交叉科学部明确聚焦跨学科领域,表明了实现既定学科在方法、理论、文化层面“融合”的雄心。

—如何测量跨学科性?—

如何量化跨学科性(比如,论文A的跨学科性是否强于论文B)?科学计量学学者一般以某一论文的参考文献作为衡量其跨学科程度的一条途径。具体来看,人们首先会去计算一篇论文参考文献所涉及的学科数量,即多样性(Variety)。例如,如果论文A引用了三个学科的论文,而论文B引用了五个学科的论文,我们倾向于认为B比A更具有跨学科性。另一个需要考虑的维度是论文的参考文献所涉及的学科是否均衡(Balance)。例如,假设两篇文章(比如C和D)都有30篇物理和化学领域的参考文献,如果C的15篇参考文献来自物理,另外15篇参考文献来自化学,而D有29篇来自物理,1篇来自化学,我们就会说C由于有更好的均衡性,因此具备更强的跨学科性。在实际操作中,科学计量学的学者一般会采用基尼系数(Gini index)来量化均衡性,基尼系数是经济学中一个非常著名的衡量收入不平等的指标。然而,多样性和均衡性这两个维度是不够的。科学计量学家提出了第三个视角,即差异性(Disparity),以此来表示学科的语义差异。例如,论文E引用了物理和化学的参考文献,而论文F引用了物理和艺术的参考文献。人们可能会认为,与物理和化学相比,物理和艺术之间的差距使得论文F显得更加跨学科。多年来,“多样性-均衡性-差异性(variety-balance-disparity)”的框架一直是跨学科研究的常用框架之一。

很明显,在这个框架中,要想精确量化跨学科性,首先需要明确定义什么叫做出版物或参考文献的“学科”。一般说来,定义学科需要在Web of Science、Microsoft Academic Graph、Scopus等文献数据库中手动分配类别,虽然这些类别一般都是在数据库中提前分配好。然而,采用这种人为分配的学科框架体系进行多样性测量的方案至少有三个局限性:

  1. 学科框架体系一旦建立,若想更改可能需要一定的时间。因此,相对静态的方案不能反映学科的演化和结构的动态性。例如,人工智能可能与多个学科融合。因此,静态方案可能无法揭示各学科之间实时的差异性。

  2. 学科分类具有主观性,从不同角度出发往往无法达成共识。例如,对于一个领域专家而言,情报学的“样貌”可能与另一个专家的看法完全不同,也就是说,“每个人的心里可能都住着一个不同的情报学”。

  3. 目前数据库中的学科划分粒度较大,不能对子领域或研究主题进行更深入的分析。

这三个局限性启发我们重新思考“多样性-均衡性-差异性”三维框架的使用。为此,我们提出了一种新的、特别是针对学术期刊的衡量方法。该方法不依赖于任何现有的主题分类方案,被称为主题多样性(topic diversity,TD)。主题多样性方法需要输入某一期刊上刊载论文的摘要,从而输出一个量化该期刊研究主题多样性的数值。

计算这一指标存在诸多细节,但其过程主要可以划分为四步,分别是:(1)词语抽取,(2)网络构建,(3)话题检测,(4)多样性计算。在第一步和第二步中,我们进行基本的自然语言处理,并通过考虑共词网络的拓扑结构来选择对后续步骤具有语义层面“意义”的候选词。在第三步中,我们检测候选主题(共词网络中的社区)并对其进行过滤以获得合理的主题。在最后一步,我们通过考虑多样性、均衡性和差异性来计算各期刊的主题多样性。

为了验证主题多样性指标,我们使用微软学术数据(Microsoft Academic Graph

Read more Read more

描述复杂搜索过程:搜索进度模型

描述复杂搜索过程:搜索进度模型

刘畅,宋筱璇

你是否反思过自己的搜索过程?大多数人会认为,有了谷歌的帮助,搜索是一件易事。那么现在请思考一下,当你需要为工作或学习任务写提案时,你可以在一分钟内完成吗?对于行为和认知复杂度较高的搜索任务,只进行单个动作很难完成整个搜索过程。相反,复杂搜索是一个探索和发现信息的、迭代的过程。在这个过程中,你需要不断地搜索、思考,并且逐渐积累自己的知识,最终完成任务。

—现在请思考一下,当你需要为工作或学习任务写提案时,你可以在一分钟内完成吗?—

你是否好奇于自己在复杂搜索过程中的经历呢?我们的研究团队旨在对复杂搜索任务中的用户搜索交互行为进行建模,从而系统、全面、细致地揭示不同搜索阶段中用户的行为特征与模式,同时刻画整个任务完成过程中用户行为的动态进化机制。该研究有助于设计与优化搜索系统,提高用户的学习技能,提升任务完成的效益和效率。

我们招募了32名学生作为被试参与用户实验。被试需要完成一系列与日常健康信息相关的搜索任务。我们将用户的交互行为分成搜索(Search)、阅读(Read)、写作(Write)三种主要的交互类型,描述了搜索、阅读、写作在任务完成过程中的模式和演变,提出了搜索进度模型(Search Pace ModelSPM),以此描述在不同阶段之中用户如何进行搜索交互。搜索路径模型如图1所示,主要包括三个子过程:探索、积累和写作/报告。

在探索(Exploration)子过程中,搜索是主导活动。搜索者尝试输入较多查询式,同时访问众多搜索结果页面来收集信息。搜索和阅读之间的切换是这一阶段最频繁的活动转换。在这个子过程中,搜索者很少写作。

当搜索者转向积累(Accumulation)子过程时,搜索活动显著减少,阅读活动占据了主导地位。搜索者访问非重复内容页面的数量增多,同时每个内容页面的访问次数也增多。搜索者在积累阶段经常在阅读和写作之间频繁切换。在这个过程中,搜索者试图理解和吸收所获得的信息,并在阅读的同时写作以此输出搜索结果。

Read more Read more

从你或他人经历中学习?——在线评级和免费试用产品对用户购买体验型产品决策的影响

从你或他人经历中学习?

——在线评级和免费试用产品对用户购买体验型产品决策的影响

李胜利

你是否曾感到在线购物时被众多选项所“淹没”?这种情况下,您需要一些能够为适合您最佳选择提供线索的帮助。特别是对于体验产品而言,在使用前更很难获得其产品信息,情况可能更严重。例如,信息产品(包括软件、电影和音乐)是典型的体验型产品。消费者认为对于体验型产品,他们更难做出购买决定。各类市场工具可以作为信息渠道,在购买前向潜在消费者提供(reveal)产品信息,在线评级和免费试用产品是其中最受欢迎的两种。

—你是否曾感到在线购物时被众多选项所“淹没”?—

有趣的是,我们观察发现消费者经常同时被提供在线评级和免费试用产品。那么,一个有趣的问题就产生了:当购买者能够同时获取在线评级和免费试用产品时,哪个是其首选?换言之,一种信息渠道的影响是否会主导另一种? 进一步而言,这两种信息渠道对不同产品类别的影响是否不同?

这两种信息渠道的本质差异在于二者如何向用户揭示信息。通过阅读在线评级,消费者从其他用户的使用体验中获得产品信息。因此,这是一个社会化学习的过程。相反,消费者在使用免费试用产品时,基于自身的使用经验了解产品信息,因此这是个体学习的过程。基于一个从CNET.com网站(该网站是一个领先的评级和下载网站)抽取的数据集,我们开展了一系列研究以探究上述问题。

在个体学习渠道方面,我们发现用户评级显著影响消费者的采用行为,而专家评级(expert ratings)的影响并不显著。这一发现证实了社会学习是一种有效的信息渠道。然而,评级来源也起到重要作用。除了用户以往的在线评级,一些评论网站可能会聘请专家体验产品并公布其评级。虽然专家可能更有见识,但他们也被认为不太值得信任(因为卖家可能会有意操控评审专家)。因此,当用户评级和专家评级同时存在时,只有前者才能有效提高消费者购买软件的意愿。该结果刊载于我们最近发表在JIS的论文中,题为《在线评论对不同产品类型的消费者免费试用行为有不同的影响吗?”——来自软件行业的证据(Do online reviews have different effects on consumers’ sampling behaviour across product types? Evidence from the software industry)》

Read more Read more

用户贡献了什么?—— 通过沉浸感分数审视420万知乎用户的活动数据

用户贡献了什么?—— 通过沉浸感分数审视420万知乎用户的活动数据

邓胜利,蒋雨婷,黎红秀,刘勇

在线问答平台中,贡献者(contributors)获得了最多的关注,但那些既不提问题也不回答的用户就没有价值了吗? 不同用户在在线社区生态系统中扮演何种角色呢,他们如何互相支持以维持社区生态呢?我们从沉浸感视角(immersive perspective)完整地探索了不同用户对知识社区贡献的互补程度。

—在线问答平台中,贡献者(contributors)获得了最多的关注,但那些既不提问题也不回答的用户就没有价值了吗?—

早期观点中的沉浸感是指游戏玩家在多大程度上参与游戏,与其他玩家一起玩游戏的体验是沉浸感的核心。基于我们的研究问题,本文将沉浸感定义为用户多大程度上参与以内容为焦点的社会化问答社区(Social Question and Answer, SQA)。特别地,就游戏社区而言,沉浸感是是一种深度体验,Brown 和Cairns (2004)基于扎根理论提出沉浸感的三种不同层次:参与度、专注程度和完全沉浸感。一个玩家会从最浅层的沉浸感和简单的参与度的经历出发。随着玩家更深程度的参与,这种感觉会向专注层面前进,更进一步,就会朝向第三个层次即“完全沉浸感”(发展)。受到Brown 和Cairns (2004)论述的启发,我们在SQA的情境下探索了沉浸感,使用用户参与度(user involvement/engagement)作为理论视角,以便更好地理解用户对某一SQA社区的贡献。

根据沉浸感的三个维度,本文构建了SQA社区沉浸感分数的维度,包括:内容贡献度(content contribution)、活跃程度(activity)和影响力(influence)。根据SQA中问答活动(所具备的)生成和分享知识的独特功能,我们将SQA的用户分为四类,他们是:i) 提问者,ii) 回答者,iii)潜水者 ,iv)问答者。本文从中国的知乎网站(zhihu.com)中收集了实证数据。知乎是一个类似于Quora的服务提供者,提供了一个大型的知识社区,其完善的机制旨在为中国(的用户)提供知识密集型内容。本研究受益于大量用户数据,使用了420万条知乎用户的活动数据已检查不同类型的用户通过集成方式对他们知乎活动的贡献;并通过使用信息熵的方法(Brown, & Cairns, 2004),计算和比较了不同用户群组的沉浸感分数。

在线社区生态系统中的多种角色间究竟是如何协作的呢?我们的研究表明,从社区互动的角度来看,潜水者(Lurkers)比SQA社区中的其他用户更加活跃。换句话说,他们通过一种不同于内容生成的方式参与SQA,在社区中充当重要角色。研究发现,提问者是对知乎沉浸感最低的一类用户群体。主要原因在于,纯提问者(pure Questioners)希望通过获取知识以帮助他们自己解决特定的问题,而并没有动力将知识提供给其他人。提问者(Questioners)将更有可能因为他们对某一SQA社区有限且最低的贡献程度,而转移至其他社区。另外,我们的分析揭示了一种“阈值效应(threshold effect)”。对于沉浸感的三个维度而言,本文中的这四类用户群体的最低阈值不同(下图中的红色虚线)。对于那些处于阈值以上分数的用户而言,具备不同问答特征的用户呈现出完全一致性的特征;对于低于该阈值的用户来说,不同用户群体的沉浸感程度呈现出不规则趋势。阈值内的取值,反映了该维度上用户表现最稳定。因此,这些阈值能够帮助我们比较不同维度上用户表现的程度,最低阈值越高,用户的总体表现就越好。在本研究中,最低阈值从大维度到小维度的排序为:活跃度 > 影响力

Read more Read more

人们如何在信息搜寻和信息偶遇之间转换?

人们如何在信息搜寻和信息偶遇之间转换?

姜婷婷, 傅诗婷, Sanda Erdelez, 郭倩

你曾经在上班的路上偶遇过移动餐车吗?假如你还没吃早餐,你可能会停下来买个三明治和一杯咖啡。那如果你上班快迟到了怎么办?你可能会继续走而忽略餐车。也就是说,你可能因为目标紧急而错过意外发现。

类似的现象在网络信息获取中也很常见。当你搜索所需信息时,搜索引擎可能会返回一条不太相关的结果,而这条结果恰好满足了另一个需求。那看不看这条结果呢?我们将用户这种困境视为“搜寻-偶遇竞争(seeking-encountering tension)”并开展了相关研究。

—因为目标紧急而错过意外发现—

信息搜寻(Information seeking, IS)和信息偶遇(Information encountering, IE)是信息获取的两种主要方式。信息搜寻是指为满足当前信息需求主动查找信息的行为。而信息偶遇是指意外碰到可能用于满足以往需求的信息。信息搜寻和信息偶遇中的个体主动参与程度是不同的,两者分别由前景任务和背景任务触发。

信息搜寻(Information seeking, IS)和信息偶遇(Information encountering, IE)是信息获取的两种主要方式。信息搜寻是指为满足当前信息需求主动查找信息的行为。而信息偶遇是指意外碰到可能用于满足以往需求的信息。信息搜寻和信息偶遇中的个体主动参与程度是不同的,两者分别由前景任务和背景任务触发。

为了理解搜寻-偶遇竞争的机制,我们对39名参与者进行了对照实验。我们重点关注任务紧急度在这种竞争中发挥的作用。任务紧急度已经被确定为影响信息搜寻过程和结果的主要因素,以及信息偶遇发生可能性的决定因素。

为了创造一个真实的信息搜寻情景,我们以搜索研究的名义招募了参与者,他们被要求完成关于电影导演乔治·米勒的传记的6个搜索任务。由于参与者都参加了《用户体验设计》这一课程,在进行搜索研究之前,我们给他们布置了一项关于心理学家乔治·米勒提出的米勒定律(Miller’s Law)的课程作业,来让他们产生一种持续的信息需求。

在实验中,我们将搜索任务作为前景任务来触发信息搜寻,课程作业作为背景任务来触发信息偶遇。由于电影导演与心理学家的名字都是“乔治·米勒”,姓名谐音使得两个任务之间建立起一种隐含的联系。两类任务的紧急度分别被控制为高、低两个级别。

我们构建了一个模拟搜索引擎,故意将与心理学家相关的结果项嵌入到与电影导演相关的查询式返回的搜索结果页面中,便于在信息搜寻过程中触发信息偶遇。我们的实验使用了眼动追踪器和屏幕记录仪来捕捉参与者在实验室执行搜索任务时的眼动数据和点击行为。

正如在最近发表的IP&M论文中所汇报的,我们成功地观察到了搜寻-偶遇竞争现象,并且获得了两个重要的发现:

首先,搜寻-偶遇竞争导致了一个双输的结果。这种现象实际上表现为信息搜寻和信息偶遇之间对用户注意力和行动的持续竞争。一方面,心理学家相关结果项的出现会导致用户对导演相关的搜索分心,包括注意力分布更加分散、查询式重构和结果检查更加频繁;另一方面,即使遇到了意想不到的不相关的结果项,用户也会迅速地返回搜索,从而无法记住偶遇的信息。

第二,任务的紧急度是搜寻-偶遇竞争的关键影响因素。正如预测的那样,前景任务(搜索)的紧急度增加会使搜索过程加快并且增强用户的选择性;而当背景任务(作业)的紧急度较高时,用户会投入更大的精力来查看偶遇的信息。一个有趣的分析结果与从信息搜寻到信息偶遇的转换有关。前景任务(搜索)的紧急度越高,转换难度越大。相反,紧急度较低的前景任务更有利于唤醒背景任务相关需求并处理偶遇信息。

我们对搜寻-偶遇竞争的研究丰富了人们对信息获取中多任务处理的理解,并为不同类型的信息行为之间的相互作用提供了一个新的研究视角。研究结果表明,需要避免任务竞争,让用户一次只关注一个任务,而不是在信息搜寻和信息偶遇之间来回跳转。因此,在设计避免竞争的搜索系统时,应该考虑用户当前的任务属性,使搜索系统能够适应于用户对偶遇信息与目标信息之间的期望权衡。

原文:Jiang,

Read more Read more

利益相关者视角:热门论文如何在Twitter上传播?

利益相关者视角:热门论文如何在Twitter上传播?

刘晓娟,王晨琳,吴鑫梅

你是否注意过那些爆火网络的热门论文?你好奇它们是如何在社交媒体上传播的吗?是否有人专门进行推广?在它们的传播链中,作者本人及粉丝、期刊编辑、出版商和其他互联网用户,大家分别承担着什么角色?他们对论文传播有何贡献?不同角色内部是否存在单独的交流渠道?这些都是我们团队非常感兴趣的研究点。考虑到Twitter是学术成果传播最为活跃的社交媒体,我们使用社会网络分析法对热点论文的利益相关者在Twitter上的信息交互模式进行探索。

—热门论文是如何在Twitter上传播的?—

学界通常把Altmetric.com每年发布的最受关注的100篇论文称为热点论文。我们抓取了与2019年热门论文相关的188653条推文进行分析。论文的直接利益相关者包括作者、期刊和出版商,非直接利益相关者包括学术同行、研究机构、新闻媒体、政府部门、社会组织和公众。通过匹配昵称、用户名、官方认证和个人资料等信息,筛选出与直接利益相关者关联的推文共1032条。由于利益相关者在社交媒体上存在特殊的论文提及动机,他们的交互行为可能会对Altmetrics指标数值产生影响,围绕利益相关者衍生而成的社会网络更具研究价值。

我们构建了一个利益相关者信息交互网络(如下图所示)。节点主要包括用户、论文以及相应的用户生成内容(user-generated content,UGC)数据。用户和UGC之间的关联包括推文、评论和转发,用户和论文之间的关系是利益相关者或对论文感兴趣的人,UGC和论文之间的关系为提及与否。另外,“@”和“RT@(转发)”是用户之间最重要的关联。对这样的网络进行分析,不仅可以识别出核心用户,还可以剖析利益相关者之间的交互模式和信息流向,从而追溯论文在社交媒体上的传播路径。

我们最近发表在《情报杂志》上的论文展示了具体过程,研究发现如下:

  • 从网络结构来看,利益相关者的信息交互网络属于稀疏型网络,但同时存在一定数量的小团体。团体内部的交互强度较高,联系较为紧密。

  • 从个体交互模式来看,作者、期刊和出版商是核心用户,政府部门和新闻媒体属于桥梁用户,学术同行和研究机构分别是最重要的信息提供者和接收者。利益相关者和非利益相关用户之间有25种交互方式。节点-关系组合类型多样,关系强度跨幅较大。

  • 从群体交互模式来看,不同属性的用户节点形成了两种形式的子网络:凝聚子群和学科社区(Alperin & Haustein,2017;Imran等人,2018)。在凝聚子群中,同一类型的利益相关者的交互对象偏好和强度有所不同。在学科社区中,内外部的网络结构受到学科分布和核心用户类型的影响。比如,医药健康学与经济学、心理及认知科学、地球科学、生物学、环境学、社会学等领域的用户之间存在直接或间接的交互关系,但强度较弱。而信息与计算科学和物理学的用户之间则相对孤立,倾向于学科社区内部的分享与交流。

我们的研究揭示了热门论文在社交媒体上的传播路径。这些论文的作者、期刊和出版商都在积极地进行自我宣传,学术同行和研究机构为构建完整的传播链提供了很大的帮助,政府部门和新闻媒体的参与可以让这些论文得到更广泛的传播。值得一提的是,本研究还从指标的应用层面探讨了使用Altmetrics来评价学术成果的社会影响力的合理性,这有助于厘清Altmetrics指标的价值。

原文:刘晓娟, 王晨琳, 吴鑫梅. (2022). Altmetrics热点论文的利益相关者信息交互模式研究. 情报杂志, 41(4), 186-192.

参考文献

Alperin, J., & Haustein, S. (2017). Applying

Read more Read more

新冠疫情对科技创新和合作的影响

新冠疫情对科技创新和合作的影响

步一,柳美君,Ying Ding

在1636年的大瘟疫期间,牛顿为其开创性的工作奠定了基础,从而深远地影响了经典物理学和许多其他领域。在2020年的新冠疫情背景下,我们对牛顿的经历被我们喜闻乐见。在疫情期间,科学家们是否会像牛顿一样产生更加新颖的结果?科学的新颖性会推进知识前沿的发展,并推动技术创新的产生。科学的关键问题之一是科学创新如何起源和发展。在新冠疫情的推动下,一个特别值得关注的问题是在非常规的科学环境和意外危机中,科学创新将如何演变。在新冠疫情期间,攻克病毒、完成恢复的关键在于找到创新和有效的解决方案,因此科学创新的重要性变得愈发突出。

—在1636年的大瘟疫期间,牛顿为其开创性的工作奠定了基础,在疫情期间,科学家们是否会像牛顿一样产生更加新颖的结果?—

许多研究聚焦于COVID-19对科学家各方面的不利影响,比如对科学家创新能力的抑制。然而,也有观点认为,“危机就是转机”,由于迫切需要快速解决前所未有的挑战和层出不穷的新问题,因此危机可能成为创新的驱动力。

 

新冠疫情期间科学创新的演变

在COVID-19期间,科学新颖性的演变可能伴随着其影响因素的变化,特别是与合作有关的因素,因为团队在知识生产中占主导地位。科学家可以通过两个渠道扩大他们可以获得的资源范围(如知识、数据和专长),以产生新颖的想法:即首次合作和国际合作。

首次合作表示两个过去从未合作过的作者之间的合作,这样科学家就在他们现有的合作网络之外建立了合作。首次合作增加了团队的新鲜感,促进了科学家的广泛接触,并有助于获得更多互补的学术资源。

国际合作可以跨越国界获得用于研究的技能、知识和其他资源。国际合作在两个相反的方向上影响着科学的新颖性。一方面,国际网络的影响力扩大了团队的“搜索空间”,从而产出更多新奇的想法,这有利于科学的新颖性。此外,国际合作造成的多样性和跨文化差异可能有助于提高创造力和高影响力。然而,由于较高的交易成本、沟通障碍和受众效应,国际合作也可能会阻碍新颖性。

 

尽管研究人员指出了阻碍国际合作和首次合作的各种障碍,但由于资源的限制和对疾病的新型解决方案的迫切需要,我们预计这两种类型的合作在大流行期间可能会增加。为了从资源搜索的角度研究科学新颖性变化的可能机制,我们提出一个问题。

 

在COVID-19期间,首次合作和国际合作是如何演变的?

 

上述讨论表明,首次合作/国际合作与科学新颖性之间存在着潜在的联系,而它们的关系在COVID-19期间是否被打乱仍不清楚。因此,我们提出第三个问题如下:

 

在COVID-19期间,首次合作或国际合作与科学新颖性之间的关系是否与正常时期不同?

 

我们重点关注冠状病毒相关领域,因为该领域的科学家受新冠肺炎疫情的影响最大,这使我们能够捕捉到新冠肺炎疫情的直接影响。我们遵循长期以来的组合新颖性的传统,根据前面的知识成分的不寻常组合来衡量新颖性。生物实体(如基因、疾病和蛋白质)构成了生物医学领域的基本知识单位,因此我们用生物实体来表示冠状病毒相关论文中的知识要素。我们应用了一种尖端的词嵌入技术,即BioBERT。

 

为了解决研究问题,基于98,981篇冠状病毒论文,我们将新冠肺炎疫情的爆发作为一个自然实验,并使用双重差分法(DID)来探索科学新颖性、首次合作和国际合作在2018年1月至2020年12月的演变情况。

 

我们的结果显示,在新冠肺炎疫情爆发后的初期,科学的新颖性急剧增加,这表明科学家努力尝试对现有知识进行新的重新组合,以对抗这种全球大流行病。在从事冠状病毒研究的科学团队中,首次合作(即团队成员之间没有合作)的比例增加,而国际合作论文的比例急剧下降。在新冠肺炎疫情之前的时期,首次合作与论文的新颖性得分显著负相关,而在大流行期间这种关系与论文的新颖性显著正相关。我们发现,在大流行期间,国际合作的论文和其对应的论文在新颖性得分上没有明显的差异。

 

随着全球化的迅速发展和经济、社会、政治和环境问题的日益复杂化,传统的正常科学观念,即假设研究系统的运行具有制度上的稳定性,已经不足以解决科学界的问题或难题。地方甚至全球的研究系统可能会立即受到外生和意外事件的影响。这项研究提供了证据,说明在大流行病期间,科学的进展与正常科学时期是不同的。

 

本篇文章的参考原文:Liu, M., Bu, Y., Chen, C., Xu, J., Li, D., Leng,

Read more Read more