描述复杂搜索过程:搜索进度模型

描述复杂搜索过程:搜索进度模型

刘畅,宋筱璇

你是否反思过自己的搜索过程?大多数人会认为,有了谷歌的帮助,搜索是一件易事。那么现在请思考一下,当你需要为工作或学习任务写提案时,你可以在一分钟内完成吗?对于行为和认知复杂度较高的搜索任务,只进行单个动作很难完成整个搜索过程。相反,复杂搜索是一个探索和发现信息的、迭代的过程。在这个过程中,你需要不断地搜索、思考,并且逐渐积累自己的知识,最终完成任务。

—现在请思考一下,当你需要为工作或学习任务写提案时,你可以在一分钟内完成吗?—

你是否好奇于自己在复杂搜索过程中的经历呢?我们的研究团队旨在对复杂搜索任务中的用户搜索交互行为进行建模,从而系统、全面、细致地揭示不同搜索阶段中用户的行为特征与模式,同时刻画整个任务完成过程中用户行为的动态进化机制。该研究有助于设计与优化搜索系统,提高用户的学习技能,提升任务完成的效益和效率。

我们招募了32名学生作为被试参与用户实验。被试需要完成一系列与日常健康信息相关的搜索任务。我们将用户的交互行为分成搜索(Search)、阅读(Read)、写作(Write)三种主要的交互类型,描述了搜索、阅读、写作在任务完成过程中的模式和演变,提出了搜索进度模型(Search Pace ModelSPM),以此描述在不同阶段之中用户如何进行搜索交互。搜索路径模型如图1所示,主要包括三个子过程:探索、积累和写作/报告。

在探索(Exploration)子过程中,搜索是主导活动。搜索者尝试输入较多查询式,同时访问众多搜索结果页面来收集信息。搜索和阅读之间的切换是这一阶段最频繁的活动转换。在这个子过程中,搜索者很少写作。

当搜索者转向积累(Accumulation)子过程时,搜索活动显著减少,阅读活动占据了主导地位。搜索者访问非重复内容页面的数量增多,同时每个内容页面的访问次数也增多。搜索者在积累阶段经常在阅读和写作之间频繁切换。在这个过程中,搜索者试图理解和吸收所获得的信息,并在阅读的同时写作以此输出搜索结果。

Read more Read more

新冠疫情对科技创新和合作的影响

新冠疫情对科技创新和合作的影响

步一,柳美君,Ying Ding

在1636年的大瘟疫期间,牛顿为其开创性的工作奠定了基础,从而深远地影响了经典物理学和许多其他领域。在2020年的新冠疫情背景下,我们对牛顿的经历被我们喜闻乐见。在疫情期间,科学家们是否会像牛顿一样产生更加新颖的结果?科学的新颖性会推进知识前沿的发展,并推动技术创新的产生。科学的关键问题之一是科学创新如何起源和发展。在新冠疫情的推动下,一个特别值得关注的问题是在非常规的科学环境和意外危机中,科学创新将如何演变。在新冠疫情期间,攻克病毒、完成恢复的关键在于找到创新和有效的解决方案,因此科学创新的重要性变得愈发突出。

—在1636年的大瘟疫期间,牛顿为其开创性的工作奠定了基础,在疫情期间,科学家们是否会像牛顿一样产生更加新颖的结果?—

许多研究聚焦于COVID-19对科学家各方面的不利影响,比如对科学家创新能力的抑制。然而,也有观点认为,“危机就是转机”,由于迫切需要快速解决前所未有的挑战和层出不穷的新问题,因此危机可能成为创新的驱动力。

 

新冠疫情期间科学创新的演变

在COVID-19期间,科学新颖性的演变可能伴随着其影响因素的变化,特别是与合作有关的因素,因为团队在知识生产中占主导地位。科学家可以通过两个渠道扩大他们可以获得的资源范围(如知识、数据和专长),以产生新颖的想法:即首次合作和国际合作。

首次合作表示两个过去从未合作过的作者之间的合作,这样科学家就在他们现有的合作网络之外建立了合作。首次合作增加了团队的新鲜感,促进了科学家的广泛接触,并有助于获得更多互补的学术资源。

国际合作可以跨越国界获得用于研究的技能、知识和其他资源。国际合作在两个相反的方向上影响着科学的新颖性。一方面,国际网络的影响力扩大了团队的“搜索空间”,从而产出更多新奇的想法,这有利于科学的新颖性。此外,国际合作造成的多样性和跨文化差异可能有助于提高创造力和高影响力。然而,由于较高的交易成本、沟通障碍和受众效应,国际合作也可能会阻碍新颖性。

 

尽管研究人员指出了阻碍国际合作和首次合作的各种障碍,但由于资源的限制和对疾病的新型解决方案的迫切需要,我们预计这两种类型的合作在大流行期间可能会增加。为了从资源搜索的角度研究科学新颖性变化的可能机制,我们提出一个问题。

 

在COVID-19期间,首次合作和国际合作是如何演变的?

 

上述讨论表明,首次合作/国际合作与科学新颖性之间存在着潜在的联系,而它们的关系在COVID-19期间是否被打乱仍不清楚。因此,我们提出第三个问题如下:

 

在COVID-19期间,首次合作或国际合作与科学新颖性之间的关系是否与正常时期不同?

 

我们重点关注冠状病毒相关领域,因为该领域的科学家受新冠肺炎疫情的影响最大,这使我们能够捕捉到新冠肺炎疫情的直接影响。我们遵循长期以来的组合新颖性的传统,根据前面的知识成分的不寻常组合来衡量新颖性。生物实体(如基因、疾病和蛋白质)构成了生物医学领域的基本知识单位,因此我们用生物实体来表示冠状病毒相关论文中的知识要素。我们应用了一种尖端的词嵌入技术,即BioBERT。

 

为了解决研究问题,基于98,981篇冠状病毒论文,我们将新冠肺炎疫情的爆发作为一个自然实验,并使用双重差分法(DID)来探索科学新颖性、首次合作和国际合作在2018年1月至2020年12月的演变情况。

 

我们的结果显示,在新冠肺炎疫情爆发后的初期,科学的新颖性急剧增加,这表明科学家努力尝试对现有知识进行新的重新组合,以对抗这种全球大流行病。在从事冠状病毒研究的科学团队中,首次合作(即团队成员之间没有合作)的比例增加,而国际合作论文的比例急剧下降。在新冠肺炎疫情之前的时期,首次合作与论文的新颖性得分显著负相关,而在大流行期间这种关系与论文的新颖性显著正相关。我们发现,在大流行期间,国际合作的论文和其对应的论文在新颖性得分上没有明显的差异。

 

随着全球化的迅速发展和经济、社会、政治和环境问题的日益复杂化,传统的正常科学观念,即假设研究系统的运行具有制度上的稳定性,已经不足以解决科学界的问题或难题。地方甚至全球的研究系统可能会立即受到外生和意外事件的影响。这项研究提供了证据,说明在大流行病期间,科学的进展与正常科学时期是不同的。

 

本篇文章的参考原文:Liu, M., Bu, Y., Chen, C., Xu, J., Li, D., Leng,

Read more Read more