对Google来说,一切都是一场人气竞赛_时时彩终极平刷技巧
资讯中心
时时彩终极平刷技巧 > 资讯中心 > 对Google来说,一切都是一场人气竞赛
对Google来说,一切都是一场人气竞赛
时间: 2018-07-14 浏览次数:5
当我看到Google推出了Googleschollar的“经典论文”部分,它是学术期刊的搜索工具时,我不禁用专业的方式捋了捋下巴。什么会使一篇论文成为经典,尤其...

当我看到Google推出了Google schollar的“经典论文”部分,它是学术期刊的搜索工具时,我不禁用专业的方式捋了捋下巴。什么会使一篇论文成为经典,尤其是对于搜索巨头?Google软件工程师Sean Henderson在一篇介绍该功能的博客文章中解释了该公司的理由。亨德森说,虽然有些文章因一项新的惊人发现而获得暂时关注,但另一些文章“经受了时间的考验”。

如何衡量长寿?经典论文选取了2006年发表的论文,论文涉及的学科非常广泛,今年被引用的论文最多。根据Google的说法,成为经典只是Google本身崛起的十年间最受欢迎的一次。

对于学术界之外的人来说,这似乎是一种不重要、迂腐的抱怨。但是学者们的经典论文为Google如何构思知识提供了一个窗口——以及理论对人们通过其服务发现的想法的影响。

* * *

Googles最初的任务是“组织世界信息,并使其能够被普遍访问”。“这听起来很简单,如果考虑到世界上的信息量和可能接触到它的人的数量,这很有挑战性。但这项任务掩盖了某些问题。什么算信息?它是通过什么方式获得的,是以谁的条件获得的?

宇宙很快就变成了意外事件。电脑是必不可少的。生活在离线、图书馆或人们头脑中的信息必须数字化或记录下来,才能“普遍”获得。那么用户必须为接入宽带或移动数据服务付费。

在较低级别,普通搜索显示谷歌的选择性。例如,对“Zelda”的查询产生了6页与任天堂视频游戏Zelda系列的传奇相关的链接。在第七页,出现了对塞尔达·菲茨杰拉德的引用。到8日,芝加哥一家叫塞尔达的比萨饼店和罗德岛新港的塞尔达咖啡馆都获得了认可。在查询中添加一个词,如“小说家”或“比萨”,会产生不同的结果,就像从芝加哥或纽波特的物理位置进行搜索一样。但该公司简单搜索的默认结果提醒人们,组织和可访问性对Google来说意味着非常特别的事情。

隐藏的真相始于网页排名,谷歌第一,也是最重要的产品。它以Google创始人拉里·佩奇的名字命名,是Google在网络搜索领域击败几乎所有前辈的方法。它通过测量网站的声誉来做到这一点,并利用这一声誉来提高或降低其在搜索结果中更早出现的可能性。

根据Internet Live统计,1994年我开始使用web时,在线上有2,738个唯一的主机名(例如,patraltic . com )。这还不够,所以在电话簿等目录中对web进行编目还是有意义的。这正是当年大网络公司所做的。它叫雅虎!

但是到了1998年time Page和Sergey Brin启动Google时,web已经非常大,包含超过240万个独特的主机。这么大的目录毫无意义。Excite在1993年已经将文本搜索商业化,1995年出现了Infoseek和AltaVista,1996年出现了Hotbot。这些和其他早期的搜索引擎使用付费放置和查询词与网页内容的文本匹配相结合来产生结果。

事实证明,这些因素很容易上手。如果查询与网页上的单词和短语相匹配,操作者可能只是为了增加排名而混淆误导性的术语。佩奇和布林提议增加一项。随着对页面内容的分析,他们的软件会利用页面的状态来决定结果的好坏。PageRank算法很复杂,但其背后的思想很简单:它将到网页的链接视为该网页的推荐。一个页面的推荐越多,它对Google就越重要。链接到页面的页面越重要,它的建议就越有价值。最终,计算出的重要性在搜索结果中排名更高或更低。

虽然Google的核心是数字,但它让搜索变得富有感情。结果感觉不错——特别是与其他早期搜索工具相比。这种反应能力就像知道用户的想法一样,为谷歌的成功奠定了基础。正如媒体学者西瓦·韦迪扬丹在其著作《万物的谷歌化》中所说,相关性变得类似于价值。但是,用韦丹的话来说,这种价值总是“相对的和偶然的”。也就是说,网页的实际相关性——无论它是否能最好地解决问题或证明ide用户最初寻求的信息——变得服从于最初的喜悦感和随后对Googles交付“正确”结果的能力的信任。而这些结果大部分来自一系列反复出现的人气比赛。

* * * * *

Google学者关于什么使一篇论文成为经典的想法,结果很像Googles关于使网站相关的想法。学术论文引用其他论文。就像链接一样,引用是推荐。有了足够的引用,一篇论文被多次引用就成了“经典”。对Google来说,“经典”还意味着什么?

事实证明,学者们长期以来一直使用引文计数来衡量论文和撰写论文的学者的影响。但有些人认为,这一衡量标准存在问题,是衡量学术成就的标准。首先,一篇杀手级论文可能会扭曲学者的引文数。另一方面,通过自我引用或者通过一群有系统地相互引用的相关学者,游戏引用相对容易。

2005年,Google上市后不久,加州大学物理学家豪尔赫·赫希试图用新的方法解决其中的一些问题。Hirschs index (即众所周知的h - index )不是统计引文总数,而是通过找到被引用至少h次的最大数量的论文(称为h )来衡量学者的影响力。例如,一个h指数为12的学者有12篇论文,每篇论文至少被其他论文引用12次。h - index降低了少数大规模成功论文对学者专业地位的影响,反而奖励了学术产出的一致性和持久性。hirschs方法也通过降低原始引用计数,在一定程度上降低了自我引用和集体引用的效果。H - index在学术生活中变得非常有影响力,尤其是在科学和工程领域。经常听到学者们要求将研究人员的h指数作为衡量成功的标准,或者对自己的h指数表示自豪或焦虑。h指数也经常被用来评估(尤其是筛选)学术职位的候选人。它也有它的缺点。很难跨领域比较h指数,这一衡量标准掩盖了个人在合著论文中的贡献,并从其学术价值——相关文章的实际内容——中抽象出学术成就。

这使得h - index与Google时代的生活非常兼容。首先,Google scholler对其影响力大有裨益,因为它自动化了引文的统计过程。但另一方面,Google帮助规范了参考计数,将其作为衡量各种信息相关性和价值的一般手段,使得这个过程在学者使用时显得不那么武断和临床化。极客们给大众带来了痴迷的数字主义。

Google学者经典论文目录不是衡量研究人员的成功,而是根据时间距离定义佳能。2006年大约是十年前的事了——对于那些经历过这一年的人来说,这一年的时间已经够长了,很难完全记住,但是最近Google已经找到了跟踪学术研究的腿( 2004年推出的学者服务)。换句话说,经典论文对Google来说是经典的,而不是对人类作家来说是经典的。

在今天的学院里,学者们凭借其生产力的数量和管理来保持专业地位——因此赫希斯嘲笑辉煌的一次性成就。通常,这意味着学术工作的产生不是因为社会、工业甚至宇宙的需要,而是因为学术生产力的轮子必须转动。追求新的方法或发现仍然很有价值,但这是一项艰苦而冒险的工作。相反,学者们在他们的领域中对特定的、当前的条件做出反应,当在绩效考核日历上衡量时,往往表现最好。

就像Google学者经典论文一样,查看2006年引用最多的论文,大部分揭示了学者们是如何有意无意地在这场赌博中取得成功的。例如,米德尔伯里学院电视研究学者杰森·密特朗的《当代美国电视中的叙事复杂性》是电影中引用最多的论文。密特尔是第一批将电视的崛起解释为高文化的批评家之一,尤其是通过像《女高音》这样具有复杂叙事的社会现实主义连续剧。mittells The take既有充分的论证,也有恰当的时机,就像《枯木》、《大爱》和《火线》这样的节目在他写这篇论文时都很享受。这一趋势在此后的十年中一直没有中断,使得密特朗的文章成为一个广受欢迎的引证。

同样,历史上引用最多的2006年论文是“历史可以是开源的吗?维基百科与过去的未来》,罗伊·罗森茨威格著。这篇文章提供了一个历史和解释维基百科,以及作为历史记录的网站质量和准确性评估(结果是好与坏)。与复杂的电视一样,罗森茨威格的论文之所以广受欢迎,很大程度上与它的起源有关。维基百科始于2001年,2005年开始对教学和研究产生重大影响。历史与百科知识有着独特的关系,这使得该领域在确定网站基准方面发挥了明显的作用。罗森茨威格的论文甚至讨论了Googles索引方法在帮助提升维基百科在搜索结果中的形象方面的作用,以及由此引发的学生使用维基百科作为第一来源的诱惑。就像Mittells案一样,这些情况在论文发表后的十年里才得到放大,稳定了它的影响力。

这种模式在技术领域继续存在。例如,在计算机视觉中,一种识别图像主题的方法是最常用的纸张。图像识别和分类在2006年变得越来越重要,本文描述的称为空间金字塔匹配的技术仍然是图像匹配的重要方法。Google本身再次成为计算机视觉方法的明显受益者。

声称这些论文像亨德森一样“经得起时间的考验”,是可疑的。相反,他们表明,最受欢迎的奖学金是在某一领域的一大群人开始关注这一问题的时候,碰巧在当前或正在出现的趋势下购买的那种奖学金,而这种兴趣并没有消失,反而被放大了。十年后的今天,报纸还没有经受住时间的考验,回顾起来,它证明了自己在正确的时刻下了正确的赌注——这一时刻也直接对应着谷歌的崛起和统治时代。

* * *

页面排名和经典论文揭示了谷歌的知识理论:值得知道的是与已知值得知道的内容最相关的内容。给定一个通过某些东西的可见性来解释价值的系统,无论是学术论文还是网页,有价值的资源总是最接近那些已经证明其价值的资源。

Google和其他人一样享受这种推理的好处。例如,当Google告诉人们它已经找到了一个主题上最持久的学术文章时,公众可能会相信这个故事,因为他们也相信Google会找到正确的答案。

但是经过进一步思考,很多Google搜索并没有产生令人满意的答案、产品、业务或想法。相反,他们倾向于指向其他声誉较高的地点,比如维基百科和亚马逊,公众也与它们建立了未经审查的信任关系。当Google列出的信息、产品和资源不能解决搜索者寻求的问题时,用户有两种选择。要么继续用越来越精确的条款和条件进行搜索,希望得到更相关的答案,要么耸耸肩,点击提供的链接,决心接受给出的内容。大多数人选择后者。

这种消费信息和想法的方式也在其他地方蔓延。值得购买的是通过亚马逊Prime发货的商品。值得一看的Facebook帖子是那些出现在新闻提要中的帖子。值得一读的新闻是即将被挖掘的内容。由于Facebook、Twitter和Instagram等服务包含了排序信息的算法方法,就像Google对搜索一样,所有这些喜欢、点击和搜索以及hashtags等都成为投票——这些建议相互结合,产生了正确的输出,这得益于之前的充分正确。

就好像承诺组织和提供世界信息的Google公司做了相反的事情。今天几乎任何东西都可以在网上发布、发表或出售,但大部分都看不见。相反,信息仍然是隐藏的,因为没有与其他更流行的信息充分连接而受到惩罚。但是,不这样想是非常罕见的,这样做的想法甚至可能不会出现——对购物者和公民来说,就像学者一样。所有信息都是可以普遍获得的,但有些信息比其他信息更容易获得。

Copyright © 2017 时时彩终极平刷技巧 版权所有