views, comments.

如何评价「人生搜索引擎」Rewind 推出 iPhone 版本,并集成 了 GPT-4? - 知乎

Omnivore

Read on Omnivore

Read Original

date_saved: 2023-08-09 09:00:17

date_published: 2023-08-06 20:00:00


Full Content:

登录后你可以

不限量看优质回答私信答主深度交流精彩内容一键收藏

很好用,很厉害,使用体验很好甚至令人恐惧——太好用以至于给我一种不信任感。

Rewind ==[1]==就解决一件事:==搜索==。搜索在你电脑/手机屏幕上存在过的任何内容。Rewind 给我一种当年第一次遇到 everything 的感觉,丝滑、流畅,在无数信息的碎片里,提取出我最需要的那个

如果抛开数据安全不谈,Rewind 就是我们一直想要的「第二大脑」,这个大脑是无感的,不需要像笔记一样去做整理,去打标签,去人工做双链——它完全静默地驻守在后台,每隔几秒钟就给你的电脑、手机截图,然后你可以随时检索任何想不起的事情,只要它曾经出现在你的屏幕上,以此最大程度地帮助你解放大脑——单从功能描述上看,是不是既强大又恐惧。

而且它要的权限实在是太多了,虽然 Rewind 承诺数据只在本地存储,我还是会非常非常担心数据问题。因为一旦放开这些权限,一旦数据失控,我整个人就真的是透明的了…


Rewind,产品如其名,倒带、回忆。它可以帮助你回忆起任何在你的电脑、手机上发生过的细节,不论是浏览记录、文档,甚至图片和视频。

其实之前 Rewind 就火过一次,最近再次大火是因为搭上了 AI 的东风,Sam Altman 在 X 上推荐了它作为 GPT-4 的客户案例:

去年,a16z 投资 Rewind 的时候,写了一篇文章介绍[2],文章中是这么描述 Rewind 的功能的:

今天的数字工作场所比历史上任何时候都要快。我们可以通过文字、语音、视频和文件进行实时沟通和协作,而且可以在全球范围内进行。我们可以通过URL共享大文件,并通过搜索栏访问无法计量的信息。然而,我们在工作效率方面仍有很大的提升空间。我们不断地在不同的任务和应用之间切换。不可避免地,我们都曾问过自己:“上周在会议中有人谈到预测时,我在看什么东西呢?我知道那很重要,我想回头看一下…可恶!我记不起来了。”
Rewind正在构建一个解决方案来解决这个问题,它通过在本地(和私密地)捕捉你所看到、听到和说的内容,并使其可搜索。今天,Rewind推出了一款Mac==桌面应用程序==。当你搜索一个特定的词语时,你会看到它在哪里发生的每一个事件,以及在发生这个结果时打开的其他内容(例如,在“==西海岸==销售”被提及的Zoom通话的部分,以及当讨论发生时你正在查看的仪表板)。由于它利用了自动==语音识别==和OCR技术,Rewind可以在不与其他应用程序集成的情况下运行

Rewind 的官方关于数据隐私==[3]==是这么说的:

为了您的隐私,您的屏幕和音频录音都存储在本地,并且永远不会离开您的 Mac。如果您选择使用我们的会议摘要或询问倒带功能,则仅相关的基于文本的数据会发送到==云端==。我们在您的 Mac 本地进行压缩和自动语音识别 (ASR)

有两种类型的信息会离开您的计算机:

  1. 产品分析:我们发送非敏感信息,例如应用程序是否打开或关闭或是否发生搜索。您的搜索查询本身永远不会发送。这使我们能够为您打造更好的产品。
  2. 崩溃报告:如果应用程序崩溃或出现错误,我们将发送详细说明所发生情况的日志。这使我们能够更快地为您修复错误。

也就是说,理论上,它们使用的是本地的 OCR 和 ASR 技术,可以在不依赖云服务的前提下,提供本地数据的搜索服务。

不过,如果要和 GPT-4 结合成问答技术就不一样了。从单向的搜索走向双向的问答,GPT-4 加持下的 Rewind 变得更强了,但是也意味着会把数据上传到 OpenAI 了。

Rewind 把这个 AI 问答功能称作 Ask Rewind[4]

至于数据安全问题,他们这样解释:

总之,使用这个产品唯一的顾虑是数据隐私安全,否则的确很好用…

参考

  1. ^https://www.rewind.ai/
  2. ^https://help.rewind.ai/en/articles/6526621-who-has-access-to-my-data
  3. ^https://www.rewind.ai/ask-rewind

更多回答

我猜肯定不只我一个人有过这样的设想,就是能有一个工具可以记录下来所有我看到的(视频/图像)、听到的(语音),以及写下来(文本)的内容,并在我需要的时候能快速的检索到对应的内容。

因为现在信息爆炸,每天要看很多信息,有的时候在一个视频或一篇文章中看到有用的东西觉得记住了,但是日后想引用这些内容的时候又忘记是在哪里看到的了

本来这个事情应该是大脑干的,因为到目前为止,只有人类的大脑有能力处理这么多种模态的信息。(LLM不行,即使GPT-4这样的多模态模型也不行)

但是奈何脑容量有限,而且像我这样记忆力一天不如一天的健忘症患者,基本已经快放弃对大脑记忆的信任了。

所以这个时候特亟需一个“电子烂笔头”,能记录并检索各种信息。其实也无需各种信息,只要能处理图像、语音和文本这几种模态的信息就够用了。

我以为这个宣称“人生搜索引擎”的集成了GPT-4模型的Rewind就是我想要的那个工具。但是再仔细了解一下发现好像并不是那么回事。

目前Rewind在iPhone端仅支持对屏幕截图和Safari浏览记录的回溯[1]

根据介绍,这个工具现在只能处理屏幕截图和浏览器记录。

?我缓缓打出一个问号。

这功能iPhone手机本身不就有吗,甚至比这个rewind覆盖的场景还要多,包括照片、截图、备忘录、浏览器记录等更多的内容。

那iPhone本身就能干的事情,我为什么还要再多下一个不如它的APP来用。

至于说它集成了GPT-4,自然也是调OpenAI API的。

所以又是同样的问题,ChatGPT也有官方的iOS应用,为什么要用第三方的呢,调教的效果肯定也不如OpenAI的好吧。

个人觉得,这样的工具出发点是好的,如果真能做成所宣传的那样,确实可以切中很大一部分用户的痛点。但是就目前的水平来看,这个 Rewind 的 iPhone 版并没有亮点,可以说平平无奇,甚至鸡肋。(希望以后能继续开发出更强大的功能吧。)

其实能看出研发人员想利用GPT-4模型的能力,但是如果想结合实际应用场景,需要很多的技术升级和整合。

现在来看,这软件两个主打功能“Search”和“Ask Rewind”还是分开的。看起来仅仅是在原来的“Search”的基础上,通过调GPT-4接口,给应用增加了一个AI生成功能。并没有在主打的“搜索记忆”这件事上充分发挥(多模态)大模型的能力;在功能上也并不出新。所以我的评价是:过。

参考

  1. ^https://zhuanlan.zhihu.com/p/648436667

就是对用户数据做人工智能分析。

这个对普通用户作用不大,类似电脑的本地搜索一下,但对于情报机构作用就大,可以精确画像你这个人的所有,包括你的各种习惯,然后使用人工智能分析,非常省事,他们的服务需要存储一个你的概要数据就行了。

这样精确画像你这个人的所有,后面可以把你的数据卖给广告商,情报部门之类。

相当于使用人工智能提取你的个人在手机的各个方面的信息。

你看俄罗斯公家部门都禁止使用了Iphone这种,因为透明性太小了。

如果有什么问题直接问chatgpt之类的就行了,如我要解决编程问题直接问chatgpt,要解决办公问题直接问,不需要关联大量的个人信息。

没有必要把自己的整个手机的信息让人工智能全面分析,很多数据对用户解决问题没有任何帮助,只是把你的个人数据做精确的用户画像,精确的信息索引和分析,这个对用户隐私数据是巨大的危害。

后面这个公司,只需要向有关部分出售数据,就可以收入不菲,但用户数据一旦泄露无法再回到过去,今年美国情报部门本身内部都泄露了大量信息,不要说这种出售的数据了。

照片,Safari浏览记录这些可以精确画像个人用户,你每天访问那些网站,拍了那些照片,这些都是非常隐私的数据,可以反向推导出你是谁,你的很多个人信息,并使用社交网络分析法,获取到你的整个社会网络信息,并进行大数据关联分析。


Highlights

Rewind [1]就解决一件事:搜索。搜索在你电脑/手机屏幕上存在过的任何内容。Rewind 给我一种当年第一次遇到 everything 的感觉,丝滑、流畅,在无数信息的碎片里,提取出我最需要的那个 ⤴️

Rewind正在构建一个解决方案来解决这个问题,它通过在本地(和私密地)捕捉你所看到、听到和说的内容,并使其可搜索。今天,Rewind推出了一款Mac桌面应用程序。当你搜索一个特定的词语时,你会看到它在哪里发生的每一个事件,以及在发生这个结果时打开的其他内容(例如,在“西海岸销售”被提及的Zoom通话的部分,以及当讨论发生时你正在查看的仪表板)。由于它利用了自动语音识别和OCR技术,Rewind可以在不与其他应用程序集成的情况下运行 ⤴️

Rewind 的官方关于数据隐私[3]是这么说的:

为了您的隐私,您的屏幕和音频录音都存储在本地,并且永远不会离开您的 Mac。如果您选择使用我们的会议摘要或询问倒带功能,则仅相关的基于文本的数据会发送到云端。我们在您的 Mac 本地进行压缩和自动语音识别 (ASR) ⤴️

我猜肯定不只我一个人有过这样的设想,就是能有一个工具可以记录下来所有我看到的(视频/图像)、听到的(语音),以及写下来(文本)的内容,并在我需要的时候能快速的检索到对应的内容。

因为现在信息爆炸,每天要看很多信息,有的时候在一个视频或一篇文章中看到有用的东西觉得记住了,但是日后想引用这些内容的时候又忘记是在哪里看到的了 ⤴️

这个对普通用户作用不大,类似电脑的本地搜索一下,但对于情报机构作用就大,可以精确画像你这个人的所有,包括你的各种习惯,然后使用人工智能分析,非常省事,他们的服务需要存储一个你的概要数据就行了。

这样精确画像你这个人的所有,后面可以把你的数据卖给广告商,情报部门之类。

相当于使用人工智能提取你的个人在手机的各个方面的信息。

你看俄罗斯公家部门都禁止使用了Iphone这种,因为透明性太小了。

如果有什么问题直接问chatgpt之类的就行了,如我要解决编程问题直接问chatgpt,要解决办公问题直接问,不需要关联大量的个人信息。

没有必要把自己的整个手机的信息让人工智能全面分析,很多数据对用户解决问题没有任何帮助,只是把你的个人数据做精确的用户画像,精确的信息索引和分析,这个对用户隐私数据是巨大的危害。

后面这个公司,只需要向有关部分出售数据,就可以收入不菲,但用户数据一旦泄露无法再回到过去,今年美国情报部门本身内部都泄露了大量信息,不要说这种出售的数据了。

照片,Safari浏览记录这些可以精确画像个人用户,你每天访问那些网站,拍了那些照片,这些都是非常隐私的数据,可以反向推导出你是谁,你的很多个人信息,并使用社交网络分析法,获取到你的整个社会网络信息,并进行大数据关联分析。 ⤴️