Google 图书计划的迷失：它能否东山再起？（下）

转载时间：2021.09.08（原文发布时间：2017.04.17）

189

转载作者：36氪企服点评小编

阅读次数：189次

者按：Google 图书是 Google 的第一个“登月”项目(Moonshot)，但15年过去了，这个项目还没有“发射”。而之后的其他“登月项目”如无人驾驶汽车、Google Glass、平流层网络气球等都引起了人们的广泛关注。本文探索了我们所不太清楚的 Google 图书计划。本文分为上、下篇，此为下篇。

前情提要：Google 图书计划的迷失：它能否东山再起？（上）

作家协会虽然在诉讼中失败了，但他们相信这场战斗是值得的。

协会主席James Gleick说， Google 从一开始就做错了。 “ Google 在开始这个项目时，没有考虑到需要这些原创作者的支持。大公司对创造性工作不够尊重。“ Google 认为自己现在是“宇宙”的主人了，但其实他们应该只是被授权使用这本书而已。”

我们理所当然地认为诉讼的胜利意味着 Google 图书这个项目的复苏，也许 Google 会改进扫描仪，全速实施项目！但是证据显示，情况并非如此。原因之一是数据库已经很大了。 “我们有固定的支出预算”， Google 工程师Stephane Jaskiewicz说道，“刚开始的时候，我们扫描图书馆每个架子上的书，有时会发现很多重复的内容“。而如今 Google 会提供给合作的图书馆一个”选择列表“。

Google 的热情退却，还有别的解释：诉讼带来的意志消沉。如今 Google 有很多激动人心的新项目，这些项目熠熠生辉且见效很快。然而对于 Google 图书项目而言，虽然扫描完所有的书籍的确很有益处，却几乎不可能真正“Change the world”。

对于许多爱书之人来说， Google 把自己视为“宇宙图书馆”是无意义的，这个角色恰恰是属于一些公共机构的。 Google 让大家知道了“扫描所有书籍”是可以实现的，很多人会涌上来解决这个问题。Brewster Kahle的网上档案馆，存储了整个网络的历史快照，它们已经有自己的扫描操作。从2010年开始，美国数字公共图书馆的哈佛伯克曼中心成为了现在许多图书馆和机构交换电子图书藏品的场所。

Google 与大学图书馆合作扫描他们的收藏，同意给图书馆扫描数据的副本，在2008年，HathiTrust 开始组织和共享这些文件。HathiTrust有125个成员组织和机构，“相信通过合作，我们可以更好地管理研究和文化遗产，而不是让 Google 这样的组织单打独斗。”HathiTrust主席Mike Furlough说道。当然还有国会图书馆，他们的新领导人Carla Hayden承诺会通过数字化开放公众的收藏品。

在某种意义上，这些都是 Google 图书的竞争对手。但实际上， Google 远远领先于他们，他们中没有一个可能赶上 Google 。大家都明白， Google 花费数亿美元来建立 Google 图书，没有人会愿意花这笔钱再做一个“ Google 图书”项目。

然而这些非营利组织相对于 Google 有一个优势： Google 会因为公司战略变化影响项目的优先级变化，而非营利性组织不会。他们最重要的业务就是书籍，不会受到广告业务或智能手机生态系统之类的干扰。与 Google 不同，在走进读者这件事情上，他们永远充满热情，寻求新的方式来连接读者与书籍。

有一种说法，无休止的诉讼会变成一阵饥饿浪潮，淹没所有的参与者（原句出自狄更斯的Bleak House，一场跨世纪的房地产战争，其诉讼的法律费用侵吞了其所有资产）。在科技领域，像著名的IBM被反托拉斯诉讼案束缚多年，这给其竞争对手提供了抢占一席之地的机会，当微软正忙于这场法律纠纷时， Google 就主宰了搜索行业。

Google 图书有其自身的价值。

正如作家协会主席Gleick指出的那样， Google 抱着“（事后）要求宽恕而不是（事先）请求许可”的态度启动了这个项目，这是现在很多创业公司的做法。从某种意义上说， Google 图书就像知识产权界的Uber，一种阅读共享的服务，期待未来向其想象的一样发展，服务于整个人类。这很天真，很快 Google 图书的反对者汹涌而来。

但是， Google 的这个教训让其收益无穷，成长得愈发强大：工程是伟大的，但这不是所有问题的答案。有时候你也要学习政治的方法，向利益悠关者请教，与盟友结队，向竞争对手妥协。因此， Google 雇佣了一批游说者和律师，在其他的问题上也采取这种办法，如同处理YouTube版权问题这件事，更为谨慎，结果也更好。 Google 成长了，它可以做到“登月”，也明白了不是所有“登月”都会实现。

Google 有可能在“orphan works”问题上会再次采取行动。但是看起来它会等待别人先出头。 Jaskiewicz说：“如果法律不变，我不知道我还有什么可以做的。”

当我在写这篇文章时，我一直在回想起几年前读过的一本书，《生命之书》（Mr. Penumbra’s 24-Hour Bookstore），这是罗宾·斯隆写得异想天开的书呆子式小说，讲述了一个百年历史的秘密社会，每个人用谜语写下自己的“生命之书”。 Google 在其中扮演了一个至关重要的角色，因为故事的中心围绕着主角试图揭开谜语。事实证明，即使是 Google 无可比拟的信息能力也做不到这一点。这需要主角和一本特别的书，提供了一个有趣的见解。在斯隆结束这个故事时说道，“完全正确的书，出现在完全正确的时间”。

这本书提醒我们， Google 的工程式方法并不是万能的。他们将一个巨大挑战分解为几个可处理的部分，再将其转化为数据，并应用有效的常规程序，这是一种有效的工作方式。它可以带着你向这个“乌托邦图书馆”迈进一大步，却无法让你到达最终目的地。

即使你到达了目的地，那也不是那个“乌托邦图书馆”，还会有更艰苦的工作在前方。因为当你把一本书变成数据时，你可以很容易地找到索引和搜索的片段，但是这没有从根本上让阅读变得更容易，阅读让你暂时地走进别人的世界，这是无法代替的体验。

到如今为止，读书的体验需要人类的全心投入。像 Google 图书这样的索引能帮助我们查找和分析文本，但使用它们仍然是我们自己的工作。无需细想（with no grand epiphany），也许追求数字化所有书籍一定会以失望告终。

像许多科技爱好者一样，斯隆说他也经常使用 Google 图书，但很遗憾， Google 图书没有继续发展，没有再继续震撼我们。 “我希望这是一个闪闪发光的，美丽又有用的东西，不断地进步，变得越来越有趣”他说。他也想知道：我们理解，因为法律原因， Google 无法让大家随意阅读这数百万计的书籍，但如果它们可供机器阅读呢？

斯隆指出，机器学习在迅速发展，“机器学习的文化有Homebrew Computer Club和早期互联网的感觉。但是要取得进展，研究人员需要大量的数据来训练他们的程序。如果 Google 可以找到一种方式取得图书语料库，按类型，主题，时间等能想到的方式分割，并将其提供给机器学习研究人员，学校业余爱好者和其他人，我打赌一定会有一些有趣的成果。“ 他认为 Google 已经在这样做了，但 Google 图书的 Jaskiewicz 和其他人都不会对外界透露。

也许，当未来的神经网络模型有了自我意识，也沉浸在卡夫卡的文字中，会如同我们人类一样，通过阅读对的书，打碎内心的冰山而感到慰藉（卡夫卡 “书可以劈开我们内心的冰山”）。又或许，它与人类不同，它将能够阅读所有扫描的书籍——真正读懂书籍，那又会如何？

译文：这只萌萌编辑：杨志芳

本文来自翻译, 如若转载请注明出处。

[免责声明]

资讯标题： Google 图书计划的迷失：它能否东山再起？（下）

资讯来源： 36氪官网