views, comments.

ai summary

这期播客的主要内容围绕了OpenAI最新推出的Sora AI技术展开讨论。Sora AI是一种先进的人工智能技术,专门用于生成高质量的视频内容。节目中,主持人和嘉宾们分享了他们对Sora技术的看法,探讨了它在不同领域的潜在应用,以及它可能对现有市场和行业带来的影响。

以下是节目的几个重点内容:

  1. Sora AI的技术特点:Sora通过时空补丁的方式,将视频分解为包含时间和空间信息的token,使得AI能够更好地理解和生成动态视频内容。这种技术让Sora在生成视频时表现出较高的稳定性和合理性。

  2. 行业影响:Sora的出现可能对视频制作、广告、教育、游戏等行业产生深远影响。例如,它可以用于快速生成宣传视频,提高教育内容的吸引力,甚至改变游戏设计的方式,让每个玩家都能体验到独一无二的游戏内容。

  3. 商业机会:随着Sora的发布,许多创业者和开发者开始寻找与之相关的商业机会,如开发相关的应用程序和服务。节目中提到了一些可能的商业点子,例如视频内容的自动生成、视频编辑工具、以及基于Sora的游戏开发等。

  4. 对现有产品的挑战:Sora的技术进步可能会对现有的视频生成工具和平台构成挑战,如Roundway和Pica等,这些平台可能需要升级或调整策略以应对竞争。

  5. 安全和道德问题:随着AI技术的发展,也带来了安全和道德方面的担忧,例如Deepfake视频的制作和传播,以及如何确保AI生成内容的真实性和可信度。

  6. 中国AI市场的现状和挑战:节目还讨论了中国AI市场的现状,包括国内AI技术的发展趋势、投资环境、以及与国际市场的差距。嘉宾们表达了对国内AI发展的一些担忧,尤其是在人才培养和创新环境方面。

整体而言,这期播客深入探讨了Sora AI技术及其对未来市场和行业的潜在影响,同时也提出了一些关于AI技术发展的深层次问题和挑战。

中国ai 发展的挑战

根据搜索结果,嘉宾们对国内AI发展的担忧主要集中在以下几个方面:

  1. 人才培养问题:中国的人工智能人才缺口较大,尤其是高层次AI人才稀缺,从业时间短。与美国相比,中国在AI领域的专业技术人才数量不足美国的6%,且资深AI人才(48岁以上)比例较低。此外,中国的人工智能教育和人才培养体系仍需完善,特别是在中小学和职业教育层面。

  2. 创新环境问题:中国的AI研究和开发面临一些挑战,包括深度学习框架的生态建设不足、大模型整合的标准化和数据融合问题、中文语料的挖掘和数字化工作不足、GPU芯片等关键技术的进口限制以及AI人才的短缺。

  3. 产学研协作不足:人才培养定位和目标不明确、校企供需对接不够、学校招生需求与就业脱节。这些问题导致了教育资源的浪费和人才培养效率的低下。

  4. 学科交叉和基础教育:需要加强学科交叉性的重视,制定规范的人工智能人才培养方案,并打造适合教学的人工智能系列教材。同时,强调数理基础和人文知识素养的培养,为交叉学科做好准备。

  5. 政府、学校、企业协同:在人工智能人才培养过程中,需要联合政府、学校和企业之力实现资源共建共享,推动产教融合的人才培养模式。

  6. AI伦理和安全问题:随着AI技术的发展,如何确保AI的伦理性和安全性成为一个重要议题。需要建立相应的AI治理法规,防止对AIGC训练的误导,追究AIGC训练主体的责任。

这些担忧指出了中国在AI领域面临的挑战,并强调了为了实现AI的健康发展,需要在人才培养、创新环境建设、产学研合作等方面做出改进和努力。

对内容的审核是否会导致本土ai在训练时候的语料对模型结果产生影响

找到了第 1 篇资料:人工智能如何在内容审核中应用? - 知乎

找到了第 2 篇资料:全国政协委员周源称「没有好的语料,光有算力模型,这个 …

找到了第 3 篇资料:高阳|通用人工智能提供者内容审查注意义务的证成 - 澎湃新闻

找到了第 4 篇资料:全国政协委员、知乎创始人周源:国内大模型面临高质量中文 …

找到了第 5 篇资料:什么是人工智能“语料库”?为什么每个人都在谈论它?_凤凰网

一共找到 5 篇资料,正在阅读…

找到了 5 篇资料作为参考:

内容审核对本土AI训练时使用的语料库确实会产生影响,这种影响可以从多个方面体现:

  1. 数据筛选和质量控制:内容审核过程中,不符合特定标准的内容会被筛选掉。这意味着AI模型训练时使用的语料库可能会排除某些类型的数据,这可能导致模型在处理被排除内容类型时的表现不佳或存在偏差。

  2. 文化和语境的适应性:本土AI模型通常需要理解和适应特定的文化和语境。内容审核可能会移除或修改某些文化特定的表达,这可能会影响模型对本土文化语境的理解和适应能力。

  3. 避免有害信息的传播:内容审核有助于防止有害信息(如仇恨言论、虚假信息、暴力内容等)的传播。这对于保护用户免受不良内容影响和维护平台的健康环境至关重要。然而,这也可能导致模型在处理边缘或敏感话题时的能力受限。

  4. 数据多样性和偏见问题:如果内容审核过于严格或存在偏见,可能会导致训练数据的多样性降低,从而影响模型的泛化能力。例如,如果审核过程中对某些群体的言论过度筛选,可能会导致模型对这些群体的理解不足。

  5. 法律和合规性:内容审核确保AI训练数据的合规性,避免侵犯版权、隐私权等法律问题。这对于AI模型的合法运营和避免潜在的法律风险至关重要。

  6. 用户反馈和模型迭代:内容审核的结果可能会作为用户反馈,用于模型的持续迭代和改进。这有助于提升模型的性能和用户体验。

综上所述,内容审核对本土AI模型的训练和最终表现具有重要影响。合理的内容审核策略可以提高模型的质量和安全性,但同时也需要平衡审核的严格程度,以确保数据的多样性和模型的泛化能力。

原文

大家好,欢迎收听《一压客》,我是 Settle,我是 E-XIA,我是龟龟 本期节目由 Podwise 赞助播出 Podwise 是一款为播客听众制作的 AI 学习软件 产品的 slogan 是 Read,Before Listen Podwise 通过 AI 对播客内容进行转录、提取、总结、分析等一系列操作 帮你掰开了揉碎了硬核的播客内容 同时与 Notion、Readwise 等平台的打通嵌入知识管理工作流 协助您的其他包括新闻、newsletter、blog 的内容帮你打造第二大脑 Podwise 也为本期听众准备了三个五折优惠码 针对本期在小宇宙与我们互动的精选回复,欢迎大家踊跃来玩 好的,那开始我们本期的节目吧 今天我们来聊聊这两天最火的 Soura OpenAI 这是给我们搞头席啊 就趁我们全国人民过春节直接给我们一波网炸 现在我觉得最难受的应该是 Roundway 跟 Pica 了 可能比这些公司的实控人更难受的应该是这些 AI 领域的投资人了 这一波可能就直接打水漂了 我觉得 Soura 能刷屏啊 最核心的肯定还是效果问题 我们今天先来聊聊这个效果吧 之前我们像 Stable Video Diffusion 就有很明显的那种闪烁跟抖动啊 而且就是一直没有很好的解决方案 我其实也挺好奇的就是为什么 Soura 能产生的这个视频 它能这么稳定 就是它里面的底层机制到底有没有什么区别 鬼鬼能不能给我们再来科普一下 这个分工不知不觉就变成了我专属科普 你看我这个名科就再来一下啊 其实我们去看以前的不管是 Roundway 还是 Pica 我们会发现这些竞品啊 你让那个人走路都走不明白 没有一个走路能走明白的 那个角度在那边晃来晃去不知道在干嘛 Soura 就非常非常的稳定 在走路或者说一些别的动作上面 手也不会乱变什么的 我去翻了一下我说他怎么这么牛逼啊 其实在 OpenAI 自己官方公开的技术报告里面 基本上都有解释 我下面的这些说法呢是结合这个技术报告 以及说我对于 Soura 产出视频的实际效果的一些理解 非常粗浅拋砖引誉一下 大家其实自己去这个技术报告里面翻一翻演得翻到 OpenAI 讲到了有一个东西叫时空补丁 是他这个技术报告里面比较重要的一个点 就是 Soura 在训练时会将视频的这个针拆成很多小补丁 那每个补丁呢它会包含两个很重要的信息 一个是空间一个是时间 时间比较好理解嘛 那空间呢其实就是这个画面元素 在这个画面中的哪个部分 这个画面中的各个部分之间的空间关系 它会有这个时间和空间信息 那你可以理解为是一种编码方式 就是我把这个视频编码成一堆时空补丁 每一个都包含了的时间和空间信息 也就是 token 我们知道其实 LM 就是基于 token 来工作的对吧 你输入 token 它基于这些 token 来预测然后输出 token 所以其实这部分是一样的 但是呢它可能更好的点就在于说 它在这些 token 里面去包含了这个时间和空间之后 让 Soura 能够更好的理解动态和结构 我觉得这个就是很重要的一点是说 一致性和合理性能高出这么一大截的原因 就是因为有了时间和空间信息 Soura 就能正确的学会 比如说当人或者说动物走路的时候 手和腿是怎么运动的这样的知识 它就可以通过这个时空信息来学到 但是呢从我的理解看啊 因为目前它这些视频都是二级视频嘛对吧 它这个空间信息其实是平面的 所以我们也能发现很多时候 Soura 生成的这个视频 在透视远近或者遮挡上面会有一些问题 比如说它官方有一个这个日本 有一对情侣在街头走路的镜头对吧 大家应该看到 我们会发现那个那对情侣 他在雨棚下面走的这个镜头啊 一会儿人比雨棚高 一会儿人比雨棚矮 然后对他这个人的身高是不稳定的 但是他的遮挡关系是对的 但是他这个透视就不对 他这个距离就不对 然后还有一个视频是有一个水人在博物馆里走 从视频上看这个水人是斜向前进的 就是他是一边往前走一边靠近墙壁的 但是在这个 Soura 生成视频里面 墙壁离水人的距离是不变的 永远不变的 所以他走的方向和这个距离也是不一样的 这个在 3 D 层面他这个可能还没有学到位 然后呢他这种生成方式 其实对于图片来说是向下兼容的 因为静态图片你就等于是时空补丁去掉这个时间数据 所以实际上 Soura 也是完全可以用来生成静态图片的 这样的话其实像 LII 这种其实就是被 Soura 给覆盖掉了 这个是其中一个比较重要的点 然后还有一个呢是 Soura 他在训练的时候 他采用那种大范围采样训练的方式 就是过去的一些视频生成模型啊 基本上他的输入数据的标准化 不是像那个 Soura 一样 他是拆成很多时空补丁 他的输入数据的标准化是比如说 全部才成 256256 分辨率的 4 秒视频 这种是作为他的输入原始训练数据的 但是 Soura 的时空补丁编码方式就不需要 对原始视频本身做这种标准化了 但是可以随便采按 OpenAI 的官方说法 是可以对 19201080 到 1080*1920 之间的 任意分辨率去进行采样训练 这种方式带来了两个比较显著的好处 一个是 Soura 可以直出各种比例的视频 比如说你想生成一个说 我是用手机拍摄的数版的视频 那 Soura 就可以直出 但是别的模型可能就没办法 他得出个方的再扩展啊怎么样的 就搞这种方式 然后直出有一个很大的好处 生成的视频的完整度会更好 之前的那些视频生成模型可能会出现 我生成视频中主体只有一部分的原因 比如说你生成一个人跑步 然后那个人可能就不会出现在这个视频的正中间 甚至有可能说他半边甚至都到画面外去了 你就看到半个人在那儿跑步 这个其实也蛮好理解的 因为你用做训练的这个原始视频 其实被采检过 那你采检过之后可能就不能保证说 我整个主体在画面内 对于模型来说他就会认为说 有一半人在跑步那种也是正常的 所以就可能会出这种一半人在跑步的这种视频 那 Sora 就不会出现这种问题 所以我觉得规矩来说的话 还是说 Sora 找到了一种 更合理正确的采样数据的方式 这就使得 Sora 有现出了很多超出期望的能力 比如说前后扩展已存在的视频 生成无限循环的视频 为同一个角色生成多视角 并且具备一致性的视频 最让我印象深刻的是 他把两个毫不相干的视频连起来的差值过渡能力 这种连接不是简单的图像变化 而是带有合理剧情的连接 就很神奇 Opya 给了几个例子 有一个比如说是从一辆行驶的汽车 变成一只奔跑的 我不知道他是个豹子还是个山猫还是什么 我就当他是豹子吧 Sora 连接出来的视频是从画面外 有一只豹子出来追车 然后车开出画面 这非常合理对不对 我第一印象是会觉得说 汽车会变成豹子 这个就不合理嘛 但是实际上不是 Sora 她出了一个很合理的过程 所以我说的这些东西 大家感兴趣的话 直接去官网看 Sora 的 technical report 就都有 它这个不是什么 艰深悔色的论文 很容易看懂的 大家去看一下 与其看那些别人传播的 不知道对错的二手信息 包括听我在这瞎扯 都不如自己去 直接去看看一手信息来的准确 对吧 我的理解可能也是不对的 当然 Sora 现在还是有一些局限性 像我前面提到的 这个透视距离的问题可能算一个 还有一个是对真实世界的一些模拟 因为 OpenEye 觉得说 我这个 Sora 感觉是一种 对真实世界模拟的一个方向 对吧 我从视频这个学习 来变成说 我对真实物理世界模拟的方向 但实际上还是就是有一些缺失的 虽然它展现出了一部分 比如说它提到说 它通过画家画画这样的提示词 它能够发现说画家的动作 跟画的变化是能够对应上的 就是画家的手在这里画 画上确实能留下画家画的痕迹 并且持续留到这个视频最后 它不会跳遍 还有一个比如说 有一个人吃了一口汉堡的视频 那个汉堡真的就缺了他咬的那一块 但是这个就不稳定 就是吃东西这个事是不稳定的 它有时候能成功 有时候不能成功 就是食物不会跟着变化 然后比如说像玻璃杯摔碎的过程 还有一个别人发出来的一个视频是 他们从沙子里面挖出一把塑料椅子 那椅子就飘在空中 还是软的 就是这些还是会有问题 就是这种物理上的模拟还是会有问题 都有待改善 而且还有一些长视频里面 会出现物体的突然出现和消失这样的情况 包括我们看到的特别多的那个什么 一个女的在日本的夜晚的街头行走对吧 他那个前面都很稳定 但是后来镜头拉到近景之后 再稍微拉远一点 你发现他那个女子的发型就变了 他脑袋上多了一个皎皎 就是这种不稳定还是会有出现 但虽然说都有待改善 但相比起现在的竞品来说 我觉得完全就已经是碾压级别了对吧 所以说我们这些做 rap 的也没啥不好的 你做这种底层模型 真的很可能就冲上去送死 像那个皮卡的那个 CEO 前两天接受采访 别人问他怎么说 他说很振奋 我已经做好决定了 我要直接冲 我要跟索拉直接对标 那现在到哪一步了呢 现在还没招到人 我就觉得虽然你信心挺大的 但有点难 对确实刚才乖乖也提了很多 最近我们都被索拉刷屏的这些小视频 各种各样的一分钟的视频 你们觉得说刚才乖乖也提到说 像 Roundway 跟皮卡对吧 你觉得对 Roundway 跟皮卡有影响之外 我觉得还有另外一点 就是因为如果真的索拉这个事情 未来它真正公开了 它在供给端的质量会明显提升吗 比现在 Roundway 跟皮卡 我们可以畅想一下 这个事儿对消费端 有真正我们的这些用户可能每天刷短视频的人 你们觉得说可能会有什么样的影响吗 我觉得内容里永恒不变的 就是成人内容 对我觉得这个对于成人内容的影响 应该是非常巨大的 当然这个不能细聊 我们就不在节目里说了 回头频道都没有了 我们知道其实平面 AI 模特 目前已经非常可用了 包括就是会动的 会讲话的那些 AI 展示的其实也蛮好的了 但是你真的要让它做各种姿势 可能还有点问题 但是按照现在索拉的出视频质量 我觉得只要再稍微叠带一些控制能力 比如说控制姿态和衣服 以后消费者看到的卖家时候视频 也都是假的 不管是走秀的也好 还是野外各种动作也好都是假的 然后我还想到一个 就是索拉不是可以前后扩展视频 还可以编辑视频吗 对 以后捶起人来 这种视频证据都没那么可信了 最近有个瓜特别火 就是春晚白净庭那个上春山的瓜 我不知道你们知不知道 闹得飞飞扬扬 我知道 对 这个瓜很有意思 一直反转来反转去的 然后特别是中间还有人发过一版彩排视频 然后发出来之后 另外一版就是支持白净庭的人又说 你这版视频是 PS 的对吧 你看那个谁 魏大薪跟春晚直播时候的动作姿势都一模一样 就有人质疑 那你想想回头等饭圈熟练掌握了这项基础之后 这种事就完全朝不明白了 可以朝上一年 以后吃瓜都不保真 然后现在不是还有很多那种解说类的视频吗 就是比如说讲解电影电视剧的 这种其实本身还好 因为它自己从电影电视剧里面 就可以有视频素材拿来用 还有很多那种 比如说讲历史故事 讲各种什么悬疑事件 或者还有解说小说 解说漫画类的视频 这种其实现在基本都是在素材库里面 去找一些近似的片段或图片来配 它不太可能去实拍一些片段 这种其实很多时候 他自己找的那些素材 其实跟他要讲的东西不是完全的对上的 所以你有时候看的时候体验就不太好 以后其实这类视频片段完全可以用 SORROR 来生成 对于看这类解说视频的观众来说 体验应该会好很多 我现在觉得说 拿 SORROR 直接去生产出那种消费级的电影电视剧 哪怕是短剧 感觉可能还稍微差点意思 但有一类产品 我感觉可能可以升级一下 就是我不知道你们听不听 像有声书或者说有声剧 我老婆经常听这种东西 其实就是小说配了对话 对,有声书它会有旁白 有声剧就更高级了 它没有旁白 它会重新演绎 就只通过对话来让你感受这个剧情 这种我感觉其实就挺适合配上一些画面来辅助的 虽然 SORROR 直接生成电视剧可能还不行 但是我低成本的使用声剧的体验升级 可能是一个可以尝试的方向 就是从这个方向开始去 AI 电视剧的这种方向去探索 我觉得是有机会的 对 然后另外我还看到有人在 X 上 他说这个是 SORROR 生成的产品广告视频 我一看效果巨好 结果后来发现不是真的 他就是蹭这个热点 实际上就是他们产品的广告 他说我这个是 SORROR 生成的 实际上它是蹭个热点 但这个我觉得后面也完全可以做到 因为产品宣传视频它其实是有一定的套路的 比如说我宣传一个什么硬件产品 我就是有一个东西在那转来转去 对吧,全方位的展示一下 然后出各种效果 其实我觉得这个通过对模型去微调或者说专门训练 感觉是完全可以胜任的 这个对于我们独立开发者应该会是一个非常有用的场景 再也不用缠别人的产品宣传视频做得多少好 我们自己有没有预算 以后就可能可以用 SORROR 这样的去直接生成一个 我觉得这个对于我们是非常有帮助的 其实对消费端的影响我觉得真的还蛮大的 但是我觉得除了刚才龟龟讲的一些 比如说可能有很多一些正面的 比如像有声书、电影这些可能 对吧,讲解漫画,可能有更好的素材 这些肯定是的,这是一些比较积极的影响 我觉得可能也会有很多负面的吧 就在 2 月 5 号的时候香港警方公布了一个诈骗案 当然那个时候在过年前 所以说可能很多人没有怎么特别关注这个新闻 这个诈骗案大概的内容就是啥呢 就是有一个是一家英国的跨国公司 他在香港的一家分公司 然后被骗子就用 AI 的那种视频合成的技术 然后把从这家公司的一个员工手里骗走了 2 亿港币 就让这个员工把公司的钱转出去了 2 亿港币 所以这个是很夸张的 2 亿港币这是多少 我觉得是我听过有史以来的 这种类型的诈骗案里面数量最大的了 但我相信这个员工他可能应该也是一个 财务相关的员工,对吧 他可能收到了来自英国总部的 CFO 的一个邮件 就说我们要做一个什么类似一个秘密交易 就需要把公司的钱转到一个什么账户上去 这个员工其实刚开始收到这个邮件的时候 他其实也是不太相信的 他觉得这应该是一个诈骗邮件 因为这种套路可能今天很多人都已经不太相信了,对吧 但是最后离奇的点我觉得就是这样 就是这个冒充 CFO 的这个诈骗方 然后就给这个员工发起了一个电话视频 发起电话视频其实也还好 我觉得今天很多一对一的那种视频 其实也很难说不让人去警觉能够把人给骗到 但关键的是这个诈骗团队 居然用 AI 技术在这个电话视频里面模拟了 合成了一个团队 就是做了一个视频会议 这个员工在视频会里面看到的就是 有多个同事在一起和这个 CFO 一起开会 都是他的同事,他都认识这些人 所以这个就很可怕了 所以作为他当事人来说 他就很大概率上选择相信了 所以说最后就把两亿港币转到了一个指定的账户里面去了 我觉得是一个很典型的一个 利用 AI 的视频技术来进行诈骗 并且还模拟了一个电话会议 我觉得这是一件真的很可怕的事情 特别是像现在 SORNA 出现以过后 SORNA 的效果能做得这么好 再往后面再迭代一下 可能就会让类似这些所有的 deepfake 变得更强了 可能真的是非常非常的可信了 对我们可以看原则这种类似一诈骗这种案件的发生 其实现在在世界也有一些组织在开始出现 比如有 C 2 PA 的组织 大家可以去搜一下 C 2 PA 这个组织它其实要做的一件事情是 它其实是用来开发技术标准的 它是一个定标准的组织 它希望能够定一套标准 用来可以去识别追踪你视频等 这些数字媒体的来源 包括图片这些在内 这个视频它是怎么产生的 是在哪产生的等等 都是可以被追踪的 所以这个组织其实今天有很多都已经加入了 像 Google OpenAI OpenAI 它自己也说了 他们自己后面都要不断的去做的 更符合像 C 2 PA 这个组织的一些标准 主要是让视频的可信度这件事情能够更容易识别 我觉得这件事其实是一个很有意义 比较真相的一件事情 我觉得也是我们所有的人其实应该去关注 这一方面的一个东西 包括我们可能所有的供应链 比如我们是做视频的 我们是做图片的 我们这些供应链上的一些产品啊团队 其实还是应该更好的去关注安全这件事 我觉得安全这件事情 以人家被诈骗两亿来说的话 这是一件真的很夸张的事情 可能就是因为你的技术 导致了别人的一个重大的损失对吧 然后所以说 其实我今天以我自己今天的个人的经验来看的话 大家知道其实在 SORNA 的发布前几个小时 其实 Google 发布了 Gemini 1.5 其实 Gemini 1.5 真的非常非常的强 百万 Token 的上下文等等 本身 Gemini 又是多模胎的模型 所以它其实发布的 Gemini 1.5 其实真的很强很强 只是说 SORNA 很快出来过后 就把 Gemini 的影响啊 这些在网上的这些全部给盖住了 所以大家几乎今天都忽略了 Gemini 根本都看不到 Gemini 了 但这个也很正常 就像大家说的 大家永远只记得世界上最高的那一座山 排名第二高的山叫啥名字 大家都叫不出来是吧 大家都知道朱姆兰曼峰 都不知道第二高的山是叫啥名字 但有可能有人知道 但是我是不知道的 但是 Google 的 Gemini 虽然说可能今天在很多方向 可能已经排到第二了 或者这样的一个位置了 不足 OpenEye 但实际上在安全这一块 因为刚才我们一直在聊安全这件事 其实 Google 是做的真的很好 我个人的体感 因为我们一直在用 Gemini 也在用 ChadGBT 我会觉得 Gemini 在安全这块的中式程度 其实是比 ChadGBT 要更高一些的 因为 Gemini 其实在定义了很多的安全等级 它定义了大概 9 到 10 个安全等级 每一个安全等级几乎覆盖了 我们今天在社会上可以碰到的一些问题 比如像刚才可能桂桂提到的 有什么成人的视频之类的 可能涉及到淫秽视频等等 也有可能涉及到种族歧视方向的一些语言 等等就是这样的一些安全等级 可能都是被 Google 今天所考虑在内了 进且这些都是通过 API 开放出来 让开发者你自己可以去控制这些安全等级的 但是像 ChadGBT 至少在今天它的 API 在对开发者一块 其实是没有这样的一个体现 但它的内部也许自己做了这样的一些安全机制 但是我们作为开发者还是今天反正是看不到 或者说也是不可控的一件事 对 我知道要把等级拉高还是给它降低 对 其实我还看到一个蛮有意思的一个场景 有人在说就是 Sora 很适合做电影导演的 Storyboard 就是它的故事版 就是因为现在电影导演他其实也要去画分镜干嘛的 他要先把那个事情先描述出来 然后道具然后其他的人才能一起协同去工作 他们现在说用 Sora 的话 他可以把故事预先用 Sora 去描述出来 相当于直接出预览效果了 但是你想说把 Sora 的这个内容 直接去用作一个电影直接拍摄出来 可能暂时还没有那么强 但是这个事就很有可能 极大的会提高整个影视行业的效率 我不知道有没有一些在其他行业的例子 你们能不能给大家参考一下 比如说你们有没有看到一些其他行业里面 可以极大提高效率的这些例子 其实这个话题我感觉他们已经说了一些了 就是像承认内容以后承认内容可能就是谁都可以干了 对吧 我不需要拥有先天的条件 我就可以干这个事 对于像视频 App 啊 广告业啊 聚集制作啊 内容二创之类的 应该都有深远影响 因为真的实拍视频是非常高成本的一件事 我以前在 B 站经常看一个 App 主 就是一个医学科普的 App 主 他其实是美国的 他就是科普那些人 比如说吃了有毒的东西啊或者怎么样 会发生什么变化 对 他的那个视频标题都是谁谁谁干了什么 这是他身体发生的变化 你会发现 对 他都是这样的 你会发现他的视频都是实拍的 他是用人去还原当时的场景 我就想 哇 你这个得有多高的成本 他得有一个团队做这个事 这个钱能赚得回来吗 估计人家是可以的 但是我觉得对大多数 App 主来说是不现实的 但是有了收纳之后 其实你自己就可以做到这个事 当然还有医校刚刚提到的这些黑灰产 我觉得也是一个非常大的剔削点 他们以后 对 你真的很难分辨这个事情 之前就有很多人提到过一个观点 就是面向消费者的技术创新 首先都会在灰产地带先发展起来 但这两个灰产地带其实今天最主要的 我们平时知道的比较多的 可能就是扎片相关的 然后其次就是成人方向的 色情方向的那些 不管是写小说的还是做视频的 昨天我还看到有消息说 现在日本的有公司 那一方面的公司 已经在开始招聘大模型的程序员了 已经专门用来做成人相关的内容了 对 大模型的程序员可能去日本 现在发展的可能还挺好的 有可能 对 因为它是有实际的用途 对 它是有实际的用途的 有人真的是要买单的今天 对 那个复飞医院可能比我们现在做的 Portoise 什么的强太多了 太多了那种 好了 我们说回到电影 因为电影这个东西 今天其实是 SOLA 出来过后 大家都在提了最多的一个点 对吧 大家都是觉得 SOLA 会改变整个电影工业 对 我也觉得 但是我看到 我觉得说 电影上还有一个点 可能会导致电影更好的平权 就是电影的机会更好的平权 他讲的是啥呢 比如就是电影 其实今天要去拍一部电影 是非常非常的困难的 整个工作流程非常非常的长 关键的是资金需要非常非常的大的资金 才能去推动一个电影的拍摄这件事 对 但是如果 SOLA 出来过后 我们电影是不是能够做 MVP 就是也能像我们开发软件一样 先做一个非常非常小的版本 然后能发布到像 YouTube Twitter Tiktok 就可以先被大家去验证你的想法 对 看用户是不是愿意为这样的电影去买单 这个东西能去用 SOLA 去做 它就非常非常的简单了 很快的就可以实现你的一个电影的故事 你的 idea 对 当然它可能有点类似一个宣传片 但可能也不是宣传片 对 它就是你的故事的一个微电影 可能就是一个微电影 对 如果这条路能走通过 就是有人说 当我实现了我自己的微电影过后 那可能就会被很多的电影方向的投资人看到 说这个微电影拍得真的很好 这个故事讲得很好 我们完全有机会把它拍成一个大电影 这个时候电影的投资人就说 我们来投钱吧 我们投 10 个亿给你 我们去组建一个团队 开始去拍这个大电影 对你发布微电影的人来说 你可能以自己作为编剧 对 你作为编剧的机会可能就来了 它可能就是有一种这种 做电影 MVP 的一个机会吧 对 刚才桂桂讲了 从我自己的经历的一些场景来说的话 那就是产品发布宣传片 我觉得这个东西真的是非常重要 特别是对我们这种做软件的团队来说 刚才桂桂前面也有提到宣传片这件事 因为其实我们以前自己带团队的时候 那个时候做产品的时候 我们也经常说要去做一些宣传片 向对外进行发布 当时那些宣传片其实我们都是要花费 就是要花钱的 然后请外面的那种专门能够去做这种视频的 比方能做 3 D 视频的 或者 2.5 D 视频的这些人 帮我们去做宣传片 其实除了需要花钱让那个人去做 其实时间成本非常的高 当时比如说我需要把整个产品的 整个剧情给它写好 我要提供很多产品的图片等等 还有包括文案 还有两边出来的效果 如果不是我想要的 其实还要不断的去迭代去修改 反正整个流程其实除了花钱 还花了很多的时间 最终才可能做出一个觉得还不错的宣传片 对我觉得 SOLO 的话 在这个场景里面应该是可以很好的解决的 因为我们可以给它提供产品的图片 包括录制一点产品的视频的这些给它 然后它可以把这些给它融合 生成新的视频可以做得更好 我觉得这是一个很强的需求 你看前两天在我们的 Indie Hacker 的 Discord 的群里 其实也有人在讨论这件事 他们怎么更好的去给产品 录制一个宣传视频 因为今天大家一起发 Product Hunk 包括我们今天现在郭一郭不是也在准备这件事 其实这件事情真的它是非常费时间的 你要去做一个宣传片 对我觉得这个是有机会的 对于开发者来说 我觉得可以去尝试这件事 我觉得有完全有可能去改变这件事情 另外一个我觉得也很有机会的地方 就是教育行业 对我们能不能让教育工作者 用 SOLA 去更好的去做出一些好的视频课程 我觉得这个东西肯定是非常有机会的 当然刚才郭一郭也提到了那种 比如去讲解历史 讲解一些动漫提到了很多的素材不够好 对那些用视频来展示一些知识的那一方面 我觉得这一方面就是做知识科普 他用视频来展示他的原理 就会非常好理解的 所以对于很多的教育工作者来说 会用上类似于 SOLA 这样的 AI 的视频工具 至少我在读书的时候 其实我发现我的老师是从来没有做过这样的视频 给我看的 因为我今天在抖音上其实学习过很多这种科普知识 他们有讲物理的讲数学的 我们大家都知道我们都学过虞弦正弦 这些三角函数 但是我们的老师在讲的时候 可能就是在黑板上去写了一些字 然后去讲解他们的关系 正弦是怎么怎么 虞弦是怎么怎么是连两条边相处 然后都得出来怎么怎么样的对吧 但是你去抖音上去收这一类的科普知识 你会发现他不是这样讲的 人家就是帮你从原开始是怎么推导出正弦 就是说会给你一个非常好的 一个容易理解的一个视频在那 他会把整个框架用视觉的方式 给你呈现得非常非常的清晰 对所以每次当我在抖音上刷到这些科普视频的时候 我就看得非常有劲 我觉得虽然说以前好像学过这些知识 但是感觉以前总没有学懂没有学到根本 对就是我觉得这也是一个很好的工具 能帮大家去做一些这种讲解技术原理的视频 对 最后我觉得刚才我们虽然说规规和我 我分享了很多的这些可以用 SOLODA 去做的一些场景 可以开发的一些产品 但是我觉得可能对一大多数人来说 SOLODA 可能今天是没有用的 哪怕我们今天在朋友圈里面 在微博上也好 极客推特上也好 有无数的人都在转载 SOLODA 相关的信息对吧 每个人都在惊叹 特别是我的朋友圈里面 那天我一刷朋友圈简直惊呆了 所有的人不管他是一个营销的人 还是投资人还是做产品的还是开发的 反正是各种人都在转发 SOLODA 的相关的信息 每个人都在发表自己的感叹 对我就觉得这个其实挺奇怪的 就是我自己觉得今天对大多数人来说 SOLODA 可能是没有用的 就像有一个网友有个经典语录我给他布置下来了 他虽然说我还不知道 SOLODA 现在能帮我做什么 但是我觉得还是要先学起来 可能又多一个没有用的技能吧 对虽然大家都在惊叹 但是真正能够让人用上的肯定还是专业人士 或者他对这方面有需求的 我们刚才讲很多专业人士 比如说你像教育行业做影视频的 他们这些人肯定都是对这个里面是有需求的 然后他们肯定会先用起来 但至于说会不会所有人都会用到 我的感觉也是不会 其实这波我觉得 OpenAI 就是把全球创业者 拉回到我们 10 年前在中国创业的时候 因为当时互联网创业不是热火朝天吗 然后每个投资人接到项目之后都得问你一句说 假如腾讯做了你怎么办 假如阿里做了你怎么办 这个问题是一个挺无解的问题 然后你看现在 OpenAI 对吧 然后你现在做 AI 创业对吧 人家都会问你一句假如 OpenAI 做了你怎么办对吧 之前最火的不是 PropagCity 吗 然后前两天 OpenAI 也说他要进军搜索领域了 对吧这个也挺麻烦的对吧 你说像我们自己作为创业者 尤其是独立开发者 我们自己能力肯定是不足了对吧 我不可能比 OpenAI 人家的技术能力更强 我能做点啥去成东风呢 而不是说我自己说对吧 我被人家 OpenAI 夸一下全部撞沉了对吧 我之前看到过 就 Sam 其实之前有在公开去讲过这件事 就是那个时候不是有很多的 类似于 PDF 的 Rapper 机器人吗对吧 然后对他那一段时间 最后不就推出了很长的 就是长的商业网能够支持你 直接上传一个 PDF 文件就去聊天 就是在那个时间的时候 Sam Altman 其实在公开就说过 就是针对那件事情进行了一个回应 就说今天的创业者们 大家一定要在 AGI 的形态上去布局创业 就说今天 OpenAI 的路径 其实他是希望走向 AGI 吗 所以在这个路径上可能有很多的机会 我们所有的人都可以去分一块蛋糕去碰一下 包括是图片视频 以及我们做了很多那种 PDF 聊天的 Rapper 等等 就对 Sam 的时候他觉得这些机会 都是他们实现 AGI 路上的 可能今天一些零碎的机会 但是可能他们在不断的往 AGI 这个方向推进的时候 这些机会可能都会逐渐的都会被消失 都会被他们以为平定 大概就是这个意思对 所以对创业者来说 他都建议你一定要去布局的时候要去思考 在未来的某一天 AGI 已经被实现了 在那个时候你去找一个创业方向应该去做什么 能够在 AGI 的形态上去做一个什么样的产品 这他觉得是创业者应该去思考的一个大的方向和问题 我觉得这个可能也有一定的道理 当然可能对于独立开发者来说 不一定非得说你要去追求最终的形态 你可能路上能够去快速摘取一些低垂的果实 可能也是一个非常好的机会 这是我们一直还是比较鼓励的一件事 回到另外一个话题 就是今天说低垂的果实 刚才不是聊到 低垂的果实里面最低垂的可能就是麦克了 对吧 所以说你可能做其他的东西 可能都会被 OpenAI 给撞成 刚才提到麦克应该是一定不会撞成的 OpenAI 怎么撞也撞不掉这一盘 对麦克的人可能看到 SORNA 的出现 简直兴奋的不要不要的对吧 你 OpenAI 每推出一个新的东西 都是在给麦克主高抢 让他们可以站得更高了走得更远 我觉得麦克真的是这个时代 有特别好的方向 虽然我们自己没有麦克 还是刚才就像 SYTE 提到的 SORNA 可能会回到 Lowang 位回到 Picard 但他肯定利好一周智能 大家知不知道一周智能 我们今天在这聊到了 可能也相当于给他打了一个广告 就是李一周对吧 他确实很强大 现在在什么抖音小红书 到处都有他的头流 头方的广告了 更可怕的是啥呢 我居然在朋友圈的广告里面刷到了他了 我觉得这个真的是一夜难静 我们不说麦克了 我还是觉得说回到 我们如果去做 2 C 的产品的话 今天可能真的我们还是要回到 消费者日常的需求上面来 对就是消费者平时真的需要一些什么 消费者平时可能真的需要衣食住行 需要吃饭 对所以说到这个点 有网友就提到说 可能还是要回来去做那种不锈钢的网块 是最好的这种是钢区 怎么用也用不坏 可能开个玩笑 回到消费者的日常的需求上来的话 可能重点就是 你的重点就是把 OpenAI 当成了一项能力 它是一个 AI 的能力 你要做的事情还是要去做那些深度集成的 事情的 对这种深度集成 它就可能说是一套比较特殊的交互 UI 那比方就是有一个特殊的群体 或者说有一个特殊的行业 他们对交互的方式可能就是有自己的一些认知 那可能就是要用那样的一套交互 那你哪怕是盯着了一套这样的 UI 这样的交互的逻辑 那其实它也是好的 对也是有人会买单的 对好 那另外一个就是软硬件结合 软硬件结合是一种非常好的深度集成的方式 特别是在中国市场 我发现中国人的消费 普通人的消费里面一定有个点 你给他一个实体的东西 他是更愿意买单的 你而不是说给他一个软件 因为软件其实是一个虚大八计的 看不见摸不着的东西 他对软件付费是没有概念的 说我花了这么多的钱 买了一个我自己都看不见摸不着的东西 这个也太不靠谱了 这几乎是中国人 大部分人类这样的一个认知 所以说你做一个软硬件结合 你给他一个硬件 那个硬件里面带来一个软件 哪怕那个软件差一点 无所谓 他觉得拿着这个东西好好 比如给小朋友做一个电子手表 是吧 或者给小朋友做一些什么学习机之类的 他觉得他买了一个东西回来 每天开箱的时候 心情都是不错的 但是你说一个软件是吗 很奇怪 对 然后还有一些特殊的群体 我觉得做 2 C 的消费里面也是可以去 消费者里面也是可以去考虑的 比如像什么做盲人 还有什么老年人 儿童这些特殊的群体 他们应该都会有一些产品的机会可以去做 当然可能最赚钱的还是儿童 但老年人也不一定 因为现在老年人口变得越来越多了 其实我之前也在看 现在中国的老年化也在变得更严重 现在老年人比较多了 大家第一个想到的赚钱的方式是啥 可能说是去开敬老院养老院 对吧 但实际上可能不是的 你去开养老院可能他已经不赚钱了 这个东西已经是很多年以前的了 因为现在的这一批老年人 他们退休推下来的这一批人 其实是类似于我们的爸妈这一代人 马上要退下来的几乎是这一代人 其实这一代人 他们可能从工作岗位上退下来 他们有退休金 他们其实是有钱的 就不像很多年前的上一代的那些老年人 没有多少钱 这一代人是有钱的 他们其实要追求很多精神层面的一些东西 而不只是一个居住条件 他们现在不缺少居住条件这件事 所以说养老院是不赚钱的 但是精神层面帮他们解决问题是赚钱的 所以就有人建议去做一件什么样的事 比如那些卖儿童的绘画课程 还有什么培训班 就是今天去卖给小朋友的那些培训班 比如以绘画为例 你那些绘画的课程现在都不需要改 这个内容都不需要改 你只需要把标题改成给老年人的绘画课程 你就可以赚钱了 我觉得这个也是一件很神奇的事情 对 老年大学是吧 对 但其实是一个老年小学 对 你只需要转变一下方向 对 把做儿童的内容改个名就可以了 对 所以其实对我们做软件也是同理的 我们能不能想到一些点子去符号这些特殊的群体 对 反正责多了 对 好 还是一句话 我之前其实看到 包括 Sororna 的出现了 还有 Germany 的 1.5 的发布 其实当时我在极客就写过一句话 我觉得说如果你的 AI 产品是有一个实际的业务 在解决一个实际的问题的时候 其实每一次大模型的升级 对你来说 它应该都是一件很兴奋的事情 而不是说等着说我是一件被撞成的 我很焦虑的事情 对 嗯 其实我觉得 OpenAI 一直以来传达出来的思路 包括它做的事情 给大家的感觉还是挺明确的 就是做 AGI 本身做底层能力 它在应用层其实就是 感觉就是更多为了展示能力 就碰一碰 比如说像 PDF 这件事 其实我理解它 更多就是给底层模型增加了 很长的上下弯这样的能力 然后它就放一个说 你可以上传 PDF 这事 你看可以干 它如果真的要干 PDF 这个事 它其实还有很多可以做的 比如说我可以管理我上传的 PDF 之类的 这些东西它都没做 没错 然后包括像之前 OpenAI 去做 GBTs 它其实也可以理解为是建立生态 扶植生态的动作 但实际上我们之前也聊过 感觉也就是随便搞搞 就都不是 OpenAI 的重心 实际上你说真的到 AGI 的终极形态 上我觉得对于我们独立开发者来说 这事就太远了点 说句实话 我不知道当真的 AGI 真的实现了那天 今天我们的这各种各样的 别的一些周边设施会变成什么样 比如说 VR 会变成什么样 对吧 MR 会变成什么样 它可能真的整个交互都不一样 所以你今天去想象这个事 你想一想就算了 真的说作为一个独立开发者去布局 可能还确实早了点 我觉得现在 OpenAI 风头正劲 要钱有钱要人有人 你去和 OpenAI 的主赛道正面对决 确实是有点没必要 当然你说你也有钱有人 对吧 你有很多钱你也能找到那些 特别顶级的科学家特别好的这些人才 你就想在 AGI 的这个底层能力上 OpenAI 一较高下我觉得也可以 但我们就不想这事了是吧 那一小刚刚说迈克这个事 一定不会被撞成 我就想起来说 Sora 刚发布第二天 就看到有个消息就是有一个图 有人做了一个 Sora 的小册子 内容是啥呢内容就是什么 Sora 提示词 30 组 Sora 的什么牛逼提示词什么的 卖 99 一份 我们都知道 Sora 现在其实都没有开放测试的 甚至还有一个 Sora 的团队的人 在推特里面回了说 现在 Sora 是没有对不能 Access 的 所以如果有这种东西要么它就是诈骗 要么就是有什么目的 他回来这么一条消息 就是大家都只能看根本用不上 这就已经有人卖上课了 而且据说这个小册子已经卖了 2 万多份 不知道真假 200 多万人家已经赚尽了 还不光是 99 他还有 999 的版本对吧 他 99 版本有两个一个是思想课 就是他除了给你卖提示词之外 他还教学你怎么用 还有那个课 还有一个 999 是卖代理的 就是我允许你卖我的 99 人家的割韭菜的角度真的是全方位 没错 我只能说叹为观止 真的是太牛逼了 我觉得卖课可能是个好生意 但是也不至于这个样子吧 真的太夸张了 套壳的机会我觉得其实是一直存在的 实际上套壳虽然说的挺难听 但我觉得其实就是在生态里面去找机会做细分 在细分里面去做差异和竞争力对吧 我们回过头来看 虽然 ChartGBT 发布也就一年多 GBT 3.5 给大家开放使用是去年 3 月份还是多少月份 然后虽然有些套壳套的比较粗糙的挂了 但很多套壳的哥们都还活得好好的对吧 比如说 Monica Monica 跟 ChartGBT 的历史差不多久 他也一年多了 很多人应该都用我是一个浏览器插件吧 对吧最早出来的时候 他其实也就是能够跟 ChartGBT 聊天的一个浏览器插件 现在都迭代到 4.0 了 对 他主页里面有一个他和 ChartGBT 的区别的展示 列了一些什么东西 列了一些就是他说 Monica 能做 但 ChartGBT 做不了的事情 比如说什么网络访问 快速写作 PDF 摘要 文档翻译之类的 这些事其实 ChartGBT 都能做对吧 也是没有那么方便 因为他是个浏览器插件 他就可能可以跟程庆时翻译一样 直接在本地翻译对吧 这些事就是 ChartGBT 做出来就没那么方便 但实际上不方便已经是一个很充足的 说我要去为他做一些东西的理由 没错 对 然后同样的像刚刚讲到 PDF PDF.AI 就是前段时间他的 MRR 已经充到 5 万美元 他也是在一开始 ChartGBT 出了阅读 PDF 的能力 之后被别人说这个 TALK 要完了 实际上他还在增长 我觉得这些都已经足够证明 TALK 机会的存在 而且他是合理性 对 TALK 这个词其实说白了就是今天 被很多这些天天站在群里 或者站在旁边去观看的这些人 造出来的一个词 其实 TALK 我觉得更专业的 其实说到 TALK 的话 它其实更的是一种真正的专业集成 它是需要一些专业能力在里面的 你需要有对行业这样的一些理解 对吧 你需要能够有那一个行业的认知 然后再去做这样的深度集成 其实一看我们以前在做 2 B 的时候 其实我们做了很多这种类似于集成的事情 对吧 那就从来没有人说 TALK 这样的事情 对 所以说我觉得这都是被一些 很多的人给污名化 不比理会有很多事 是的 其实刚才桂桂有讲到一个东西 就是说现在有钱有人的情况下 我在底层能力上面 我跟 OpenAI 想一较搞下这件事 我就想到说我们现在国内的这些 AI 大模型的这一波 你看现在搞得很多 不管是搞开源的还是搞 B 源的对吧 我们就对比看一下 就你像 OpenAI 这个产品 因为它是一个全球化的产品 对吧 然后国内现在我拉出来一个做得最好的 应该就是百度的文西英言了 但它其实是一个面向国内的产品 它不是一个面向全球的产品 对然后 OpenAI 现在定价是 20 美金 大家其实买的时候还趋之若鸥对吧 国内还有好多人说 到底怎么访问炸 GBT 是吗 还给很多人了很多卖账号的机会对吗 对然后文西英言现在它其实也是收费的 然后现在是 49.9 人民币一个月 其实相比之前国内的很多付费软件 比如说我是一个视频会员 或者说我是一个百度网盘 其实他们的价格都很低的 基本都在 20 块钱左右 对我觉得这个价格其实已经提高很多了 但是你去回看一下国内这种付费环境 还有这种支付意识对吧 我觉得这个能卖出去多少 我觉得这个很难说 但我觉得因为你在国内这种公司 比如说你是百度对吧 你也不能说一直去用爱发电对吧 你也不能说我 49.9 然后我卖不出去了 我后续出去不断的投钱 但人家 OpenAI 这个 20 美金的对吧 人家是不断的滚起来的对吧 也不断的有人掏钱 他拿着他的营收 然后又过来去支撑他的去做新的研发对吧 那我觉得说一旦你做到这样的程度的时候 他后续持续运转的过程里面 他这个差距会越来越大的对吧 因为你不可能说 我一直持续不断的去投入我没有产出对吧 我觉得这个我觉得是现在国内跟海外 AI 产品 我觉得是一个比较大的一个鸿沟 就是很难去弥补的 就是你在一个像我们中国这样的一个地方 就是大家可能付不起那么多钱对吧 但如果说你是面向全球面向北美面向欧洲的 等大家支付意愿就会高一些 我觉得这个是一个后续会持续不断拉大的一个差距 对我觉得这样看下来 就我对国内的 AI 还有点挺悲观的 我不知道你们怎么看 其实我觉得也不是国内的付费环境或支付意识的问题 当然有一定影响 但是说句实话 比如说我和一笑也是国内用户 那你让我选我肯定也是选 OpenAI 20 美金对吧 想着反了要给人送钱 我要付这个钱 当然不是说不求最好但求最贵对吧 是因为确实人家贵的效果更好 而且我觉得很重要的一点没那么多限制 虽然人家可能比如说有一些安全上的考量 但是人家是可控制的 那国内的模型这不能回答那不能回答 然后问急了还给你瞎编 那究竟哪些回答我就不说了 但是可想而知以后放到图片视频生成领域也是一样的 这不能生成那不能生成 想想就不想用了对吧 那这个问题你要说要怎么解决呢 反正我是没什么办法 但这是一方面 另一方面我觉得关联的就是人的问题 因为像这种我觉得 AGI 最重要的还是人 人下面才是钱 我不知道大家知不知道前学生质问呢 就是前学生以前问过一个问题 为什么我们的学校总是培养不出 杰出的科学创新人才 这个问题没有人回答 觉得也不是说大家不知道怎么去回答 大家可能知道答案但是没法说 Sora 的两位主导者都是伯克利 2023 年的博士毕业生 人家虽然是博士刚刚毕业 然后 Sora 背后被认为很重要的一个理论论文 作者之一是华人谢塞宁 虽说是华人但技术成果却不在中国 我觉得就是 AGI 基础能力的突破和进步 肯定是需要顶尖的这些科技创新人才 我们不讨论教育体系的问题 这个其实很多人都有聊过 因为你不管说他硬是也好还是怎么样也好 不自由也好 我觉得是扼杀创新的这个话题太大了 但我们就说回来单说 刚刚提到的对于模型输出的这种限制 我相信没有哪一个顶尖人才愿意自己的智慧 自己的探索最后落地是这样的结果 对吧 我好好的这个成果最后落地出来还是要被阉割的 我觉得谁都不想是这样子 所以说悲观我是挺悲观的 我觉得这个问题很难解决 不是付费医院或者说不是有没有钱的问题 解决不了 OK 鬼鬼你这个悲观的是一个更大的问题的悲观 还不是一个 AI 能不能追得上的问题 对吧 我其实有两个观点一直 当然我觉得也有很多人其实也有这种观点 以我接触下来看的话 就是说首先第一点 第一个观点 国内的科技公司其实立足全球的特别少 我们其实自己也知道对吧 哪怕阿里云这种在做出海 他们其实只是叫出海对吧 在海外布来一个站点或者哪儿再布来一个点 但其实和你那种做全球服务型的 我觉得还是有点不太一样的 毕竟你就可能不愿意用同一套系统 同一套逻辑去服务全球用户嘛 对吧 反正我觉得这个是完全不一样的 国内的科技公司很少很少 但这个也与我们以前 包括我们自己以前在做创业的时候 在公司里面的时候其实也有聊到 都说我们国内的市场其实已经足够大了 足够我们经常去分析 我们国内的市场容量有多大 美国的软件行业当时容量 到我们中国现在在一个追赶的阶段 它在未来可能会变得多大多大 我们总是有这样的一些分析的 PPT 和报告 那个时候我们总是觉得说我们的人口足够多 我们的市场足够大 我们只需要把中国市场做好 我们就可以赚很多很多的钱 我们就可以把公司做得很大 其实这个是在中国的很多的软件公司 互联网公司里面 其实是特别严重的一个现象 还是那句话水能载舟亦能覆舟 对吧 我们今天盯着中国市场去做 不去出海不去做全球市场 对然后你在这边觉得说能赚到钱 可能在未来你赶国际赶全球的差距 只会越来越大 因为每个地方的人的需求这些都是不一样的 可能对你的产品的要求也是完全不一样的 今天只停留在家门口 你的要求可能是非常低的 可能是很低的 可能到国际上去到全球 你可能你的质量水平就禁不起考验了 所以我觉得这是一个面对不同的市场的时候 你自己需要做到的挑战程度是不一样的 当然就有点类似于叫什么的温水煮青蛙的 你可能就会变得越来越不够好了 对别人就跑得越来越快 因为往往跑得快的人 其实他是在那种环境下被迫使着 被推着跑得更快 就是被用户推着 对我们的用户可能虽然说多 但是可能质量或者并没有那么精 对要求没那么高 就像前面提到的就是那种 他可能对软件这件事情的认可度就没有那么高 就是软件只要能用都好了 甚至我们有时候审美都不够 我们觉得说 因为其实你去看中国人的普通家庭的电脑 这次大家也回家过年了 大家应该到回乡下或者啥的 那些小的地方去看他们家里放的那台电脑 一台 Windows 电脑 Windows 的系统的版本可能都还是处于一个非常低的 里面他们谈到各种的乱七八糟的广告对吧 现在就说我想说的点是这儿 中国今天其实有很大的一个群体 他们对电脑对软件的审美 以及那种资量的要求 其实还处于一个非常低的一个水平上面 他就是这个问题 他并不是说一个高标准高要求的 另外一个点观点就是关于投资的问题了 就是国内的投资机构还包括了一些大企业 大企业就包括什么阿里、腾讯、百度在内 我是坚定的认为他们在基础基础上的投入 和耐心都是不足的 我觉得这方面的影响是很大的一个点 因为投资机构其实我们打交道也比较多 他们其实很多还是要追求回报的 哪怕你是做基础技术的 其实都是需要你追求回报 其实和刚才戴头提到的问题其实还挺像的 可能就是因为我们太穷了 然后就更看不到你做这种回报 大家还是希望赚钱 然后在自己的国内又很难赚钱 大家说实话没有钱可能就还是需要钱 包括投资机构大企业在内 大家可能这种耐心就变得不足了 但是你去看 OpenAI 的融资 那就很夸张了 它从 16 年开始一路融资一直都是在融资 然后前面几年也是没赚很多钱 在最近的一次它应该是被微软的融资 达到了近 100 亿 后面接下来还在继续的融资 对 也是一件反正挺夸张的事情的 然后不断的投资机构给他去送钱 然后帮助他走了这么长的路 其实 Google 就不用说了 Google 其实也是一样的 虽然说 Google 现在我们认为它在第二梯队上 但是 Google 其实在 AI 方面的投资 其实一路都是没有减少的 一路在疯狂收购了很多的 AI 公司 其实 Google 一度肯定是被号称为宇宙最强的 AI 公司 其实只有当 Chad 的 GDP 出现的时候 才开始在打破这个局面 对 当然 Google 现在其实还是很强 只是说前面就是挡在 Google 前面 现在有一座很高的山 需要它去挑战这样的一座山 所以我觉得这两点是导致了一个 我认为是一个很关键的原因 对 你刚才说 OpenAI 的融资 确实 OpenAI 是被钱堆起来的 很多人之前因为 OpenAI 其实他要做一个不盈利的一个公司 然后做一个开源不盈利的一个公司 然后后来慢慢变成一个闭源 然后要盈利的公司 中间也发生了很多很狗血的事 然后前两天其实奥特曼也要说 他要融资 7 万亿美元 然后要自建芯片供应链 因为最近一年多 其实 NVIDIA 已经涨到天上去了 从 100 多已经涨到现在 700 多了 可能现在从奥特曼自己的角度上来讲 他觉得现在显卡技术芯片这个东西 已经成为阻碍 OpenAI 发展的 一个很大的阻力了 然后他自己去中东那边去融资 然后想说融 7 万亿美金 然后去做那个东西 然后我觉得就真的需要这么多算力吗 还是只是说要 7 万亿最终融个 1 万亿 然后也很爽了 那是的 对 其实我不知道他是融 7 万亿来做什么 还是说是用来去做芯片 整个供应链的创新 或者说做整个颠覆改造 能够把芯片做得更好更高效 对吧 现在比如说你要用 10 张卡 他非得给你优化成只需要用 1 张卡 是朝这个方向去努力了 还是说我就是要融 7 万亿来 要买那么多的 GP 我觉得这是完全是 对完全不一样的一件 但我的感受是 如果你说融 7 万亿美金来 我们要去买这么多的显卡 买这么多的 GPU 我觉得这个真的是一点不符合 那种大家推崇的第一性原理 也就是马斯克经常喜欢的第一性原理 是吧 你看马斯克在优化特斯拉的成本上 是吧 总是吹我是从第一性原理的考虑 我最近也看了很多特斯拉的 压轴机相关的历程 我们去造一个车 最后发现成本为什么那么高 很多时候我们不断的再去把车 几部分造各种零件 最后再去给它拼装到一起 才构造整个车架 让他觉得时间周期和成本都太高了 我们需要用一个一体压轴机 能够把车一把给它压出来 因为一体压住这件技术 其实在以前很多年前都是有的 在早期它是用来压住什么东西 比如说用来压住玩具 你做一辆玩具车的时候 我们经常看到有的玩具车 它就是一体成型的 所以那个时候马斯克他就提出说 你看这些玩具车都能用 一体压轴机一把给它压出来 我们真实的汽车为什么就不行了 然后那些压住的厂商就说 主要都是那个压力不够大 其实核心点就才压力不够大 他觉得压力不够大 那我就加大压力 他说你把那个压力给我加大成千上万倍 让他能够压汽车就好了 所以说就去发明了一体压轴机 最后就把这个成本给打下来了 对就是我觉得这确实也是个点 其实今天回过头来看 AI 的算力问题也是一样 我们的算力跟不上我们要消耗很多的能源 很多的 GPU 然后靠 NVIDIA 一家公司也提供不了 这么多的 GPU 的情况下 为什么没有人回到算法的本身 就是因为我们的算法太好算力了 我们的算法是不是有优化的空间 能够寻找到更经济的办法呢 其实这个问题其实马斯克自己也提过 当然我自己其实是不知道的 是不是真的需要这么大的算力 也许可能这个算法本身可能就是解决不了 至少在今天的这种底层的模型的架构 比如什么 Transformer 的架构上 可能它就是需要这么大的算力的 当然我自己也不是这个领域的专家 但是我是非常很愿意去相信 AI 的底层的架构 包括像什么 Transformer 的这些模型架构 在未来应该是会发生更大的变化的 甚至可能会有新的替代 Transformer 的底层的架构出来 来去节省 10 万亿的这件事 我自己反正是愿意相信这件事 但是能不能做到 其实我自己因为不是这方面的专家 我自己也不知道 因为我觉得只有相信它朝这个方向去发展 感觉上更合理一点 否则 7 万亿我觉得也不够 在未来可能 70 万亿也不一定能够 我们如果真的要 7 万亿的芯片 那你还不得搞几座核电站出来对吧 未来 NVIDIA 还不得继续飞天了吗 我觉得能把芯片的风头能打下来 那可能就是等哪一天可控核聚变的出现的时候 可能 NVIDIA 的风头就被盖过了对 很夸张 我觉得奥特曼说要自建芯片供应链也可以理解 毕竟你畅想的 AGI 的未来真的实现 是不是起码得做到人人都能买得起芯片 你不能说今天 4090 一张 1 万多 你不可能每个人都买得起 以后能做到说比如说人手一张 那时候肯定不是 4090 了 4090 有点久 得买得起对吧 所以我觉得可能他要做自建芯片供应链 肯定是希望说能够以后做到 所有人都能买得起芯片 当然刚刚一下讲到更经济的事 因为我们知道现在 AI 的神经网络 其实就是模拟人脑过程的产物 一步步释出来的 我们一般认为说人脑的功耗 功耗是 10 瓦到 20 瓦 当然人脑其实是很偷懒的 因为他在工作的时候 其实可能只有 10%或者甚至 2%的神经元在工作 如果你真的全部工作起来的话 他功耗还是挺高的 但是反正他现在功耗大概差不多 就是 10 瓦到 20 瓦之间 一张 4090 的标准功耗是 450 瓦 差了二三十倍 我觉得这里面应该还是有优化空间的 但是这个怎么优化我不知道 说不上来 但我觉得也可能是一个相对比较长的过程 然后跑模型和训练模型我们也知道 它需要的算力也完全是两回事 同样类比到人身上的话 我们每个人自己脑子里的东西 可都是几十年攒下来的 对吧 大模型其实它需要在很短的时间里面 去学习这些东西 而且它学习的还不是每个人自己学的这些东西 它学习的是全人类级别的知识或者数据 虽然类比也没有那么精准 但是我觉得也能大概理解说 学习训练模型要多少算力来堆 要多少脑子来堆这个事 另外我也是觉得说算力这个事 你不管说 AI 它功耗降不降低对吧 效率提不提高 算力也是不嫌多的 因为真的在 AGI 实现的年代的话 算力其实就是生产力 其实今天也是了对吧 算力就是生产力 毕竟虽然人脑功耗很低 人脑虽好 但是不能说我给脑子插上电就能工作 但是芯片可以芯片插上电就能工作 所以哪怕它今天功耗高 它还是比人的成本低对吧 所以我觉得这个事其实也合理 不管是说从生产力的角度 还是说从 AGI 的未来的角度 我觉得都可能算是有必要的 只是这个路会怎么走怎么发展 我们得看一看 对 反正到底是 7 万亿还是 70 万亿的芯片 我觉得这个就交给 Altman 自己去去种了 我们还是聊聊我们跟我们自己相关那些事 比如说你看现在 Soul 出来之后 我们身边尤其是在推特上面 然后就有一堆人注册了包括什么 GetSourApp SourVideo SourPrompt 就一堆的这样的域名 就感觉大家又发现了一个历史级别的一个套格机会 我不知道你们怎么看这个机会 因为刚才我们有聊了就是卖客的那个事 我觉得除了卖客应该还有很多别的机会对吧 我不知道你们怎么看 或者说我们有没有想要说怎么参与 我是觉得这些人真的商业还挺敏感的 并且行动力也很强的 我个人是真的是很佩服这些人的 我不会觉得说这些人是怎么样 好像又要开始准备割韭菜了 这些人真的很佩服 这中心的很佩服 从我个人的角度我觉得说 我们能找到这样的一个套格的机会 能够快速套一把 能够给别人提供一定的价值 然后我们能够赚那一笔钱对吧 我觉得这真的是一件很好的事情 我自己也是很喜欢 很想去摘取这样低垂的果实 我其实也鼓励很多的 引地海客的同仁们 大家其实脸皮也可以厚一点 也可以做一点这种套格的事情对吧 不用害怕别人质疑你 质疑你在割韭菜 对但是我们其实也没有必要像刚才 归归分享的卖客的案例那样 我们今天卖了那么多的钱 99999 然后去卖的是一个期货对吧 对 对对对 所以说我们可能不会去做那样的事情 对但是我觉得我们还是要去套个口 相应的给别人提供一点价值 然后赚起合理的费用 对我觉得这个是非常合理的 我说一下我自己思考过的几个点子 这也供我们的所有的听众的朋友 可以有兴趣的也可以去实现 干净的去行动起来 都是可以的我们自己当然 有兴趣也是可以去做的 比如说第一个点子 比如说做 Portoise 的短视频 我能不能用它来把我们今天的播个节目的 那些知识内容给我核心内容 给我讲解一下 大家有没有看过一个视频节目 叫小林说对吧 小林说横祸横祸对 他是专门讲金融讲经济讲商业的 先排除掉小林说小林那个人 那个人物的形象 他里面其实会有很多的那种知识的那种素材 在展示他的一些知识点 把那些知识讲得非常的偷测讲得很好 我觉得这一类的节目其实看着还挺有意思的 因为它是有知识的 另外 Portoise 本身今天 它就有很多的文本知识的存在了 这些知识 它其实有可能结合视频 用一种更好的方式呈现在大家的面前 并且用一种短视频的方式 就不会长达一个小时这样的方式 让大家根本看不下去 如果是短视频就一分钟 大家可能就消化掉了一篇播客节目 并且带有视频的动画效果 这个可能体感就会好很多了 对 然后还有前面说过的什么产品展示视频 宣传视频 我觉得这些都是可以做 也是我们自己实际碰到的一些痛点 对这些其实都是可以做的 但是其实我自己最想要的一个东西 就是视频界的美图秀秀 我觉得这个东西对我来说真的是 如果有人做了 我一定会去用这个软件的 因为我自己和我身边的人 其实都是非常喜欢拍照的 在发朋友圈发照片的时候 其实大家都会对照片做美化 对吧 加点绿劲好看一点 这些几乎是今天发朋友圈这些的强需求 但是大家有没有想过 为什么大家发视频发的少 哪怕就是微信出了能够发几秒钟的短视频 发的很少 因为短视频它就是拍了一个真实的视频 那个视频拿下来 它首先它不太好看 说实话 因为你自己不懂晕镜 飞镜剪辑这些东西 它也不剪可能就是直接的 就不太好看 但是我发照片这个东西 我一定会美化它 加点绿劲 对 所以大家还是更喜欢发照片的 但是如果我们能把视频的成本给它降下来 我能做一个视频界的美图秀秀 我在一段的旅行里面 我可能就随手用我的 iPhone 拍了几段视频 然后我就把这几段视频一选 选进去 然后它就自动给我剪辑合成 因为 SOLA 现在合成视频 这些就像刚才桂桂不是分享科普 SOLA 的时候 就已经讲过它在合成视频的时候 特别有故事性有逻辑 并且融合出来的过渡效果都特别特别的好 我觉得把这个东西给我做成一个产品 可能我就非常愿意在我的旅行里面 日常里面 我可能去发的不是照片 而是一段四几秒钟 或者十秒钟的一个视频 我觉得至少我觉得 它比照片的发朋友圈的吸引力 能够呈现这种日常的效果要好很多 反正这是我很喜欢的一个 APP 现在我还没看到有这样的效果 也能找到好的场景的话 肯定是可以参与一下的 当然现在你哪怕找不到场景 先占坑洽流量 也不是件坏事 刚刚 SATO 提到 GetSOLA APP 那哥们其实通过这个落地页 向自己另外的产品导流 它其实也实现了变现 它在这个落地页上面 给自己另外一个产品加了一个优惠码 说我这个东西可能还要一段时间 你要不看看我另外一个产品 然后就有人买了 对它也实现了变现 然后也没有割韭菜 没有 99 去卖一个期货 我觉得也挺好的 当然从我的角度 我肯定还是希望说能找个有需求的场景 去做应用层的东西 音效说了几个点子 我觉得也挺好 我觉得没有充分利用到 SOLA 无中生有的能力 我前两天看到一个网友提的一个点子 让我印象特别深刻 我觉得能做出来的话 真的挺牛逼的 他就说了一句话 他就说未来的游戏 是不是能够做成说 根据一段 Program Port 再结合控制器的输入 实时输出画面 你们可以想象一下这个事对吧 就是我的游戏其实是一段 Program Port 比如说交代了这个剧情走向背景故事 然后这个画面是完全由这个 AI 实时出的 然后再读取你的控制器的输入之后 再实时输出下一整个画面 如果真的能做到 每个人每一次玩 它都会是一次非常真实 且完全独一无二的体验 而且每个人都能简单的创造自己的游戏 为自己去设计独特的体验 再结合上比如说 VR 之类的技术 真的显然空间非常大 这个就是一种颠覆性的 就是以前是做不到的 只有说今天有了这样的 AI 才能做到的事情 当然因为今天 Sora 还没正式发布 我们都还摸不到 是真的非常希望说能早日上手去探索 Sora 的能力和边界去找到合适的场景 没错 对我觉得假如规规能实现的话 每个人真的可以活在梦里了 是的 对吧 就完全活在梦里了 我也是非常期待 Sora 能够早日发布 但是我觉得别像 Pika 一样见光死 因为 Pika 其实一开始的宣传图 做得非常好 然后大家在用起来之后发现 还差点意思 我是觉得说像 Sora 的话 它未来的 Token 消耗量肯定十分巨大 然后这个套壳的价格 比如说我们现在去套壳 套一个图片的壳可能 39 美金一个月对吧 可能未来套 Sora 的这种壳 可能保底会 99 美金一个月 你可能维护 1000 个用户 你就盆满钵满了对吧 我在这里再提醒一下大家 像现在全世界最知名的一个独立开发者 Peter Leveaux 他其实在这波图片的套壳里面 他做了两个应用 一个是 Photo AI 一个是 Intel AI 一个是做房屋装修的一个 AI 图 然后一个是做那种模特生成的一个 AI 图 他就靠这两个玩意儿 就做到了 10 万美金的 MR 他是全球最知名的一个独立开发者 他其实有一小半的营收 都是在最近这波套壳里面产生的 对我觉得 Sora 肯定也有这样的大量的机会存在 然后我觉得如果大家能够想到一个好的解决方案 不管是视频版的美图秀秀 还是活在梦里的一个游戏生成对吧 我觉得如果真的能做好这个解决方案 我觉得一定会有收获的 好的我们本期节目就先到这吧 感谢大家收听 大家再见 好大家再见 好拜拜 以上就是我们本期播客的全部内容 感谢大家收听 也欢迎大家踊跃留言 如果你喜欢我们 欢迎点赞并分享给感兴趣的朋友 如果你在用苹果播客收听 也希望你花几秒钟给我们一个好评 这会让更多的人了解到我们 要是能再点击一下订阅 那就再好不过了 我们下周见 我們下期節目再見