视角


我们相信,好的投资人要具备宏观、中观和微观三个维度的认知与思考能力和视角;拥有足够强大的体力、脑力和心力;以及不断提升的数据、算法与算力。

中国经济已与世界经济深度融合,下一个中国,亦在中国。在快速变化的科技与投资领域,源码资本一直以敏锐的市场洞察力和前瞻性战略引领行业发展。近期,我们成功举办了源码资本投资者大会,汇聚了来自全球的投资者、行业领袖和创新者,共同探讨和分享了对当前市场趋势和未来机遇的深刻见解。 我们的管理团队和投资团队在大会上分享了对AI、机器人等关键技术趋势的深入分析,以及这些趋势如何塑造未来的投资机会。 源码坚持投资于科技驱动的创新,投资于持久真实价值的创造。我们相信,通过我们的洞察和战略部署,源码资本将继续在投资领域保持领先地位,并借由投资富有潜力的初创企业,持续推动经济和社会进步。我们期待与所有投资者和合作伙伴一起,迎接新的挑战,抓住新兴技术带来的无限可能。源码资本将继续作为连接创业者、投资者和行业的桥梁,共同推动社会向更加智能、高效和创新的未来发展。 曹毅AGM演讲节选 高度比广度更重要 源码资本十周年,而我在风险投资领域也已经20年。如果要分享作为个人以及公司,在20年来最重要的价值观方面的思考,那么我会说:高度比广度更重要。 换句话说,我想强调商业模式的重要性。当20来岁的我成为一名风险投资人后,我的大部分时间都专注于公司从0到1的过程,大部分精力和才智都用于判断PMF(产品市场契合度),判断正确的产品能否拥有合适的市场。 PMF非常重要,这是创业公司的关键,赢得胜利或生存,拥有0到1的过程。但是,当你拥有最好的投资商业模式时,你可以享受从1到10、甚至从10到100的过程,而不仅仅是从0到1。 我们在过去已经积累了优秀的投资回报。但最重要的是未来,高度比广度更重要,我们将更加专注于投资最好的商业模式、最好的创始人。 过去,我们有一些经验教训,以为随着AUM的扩大,更多的人可以保证更好地投资。但是现在我们认为,如果有好的组织和人才,精简、有活力的团队反而能做出更好的成绩。 国内外环境都在发生深刻变化,以AI为代表的科技发展,将带来深刻而广泛的社会和经济变革,中国的AI正在迅速发展。中国的创业者也持续进化,他们更加以股东为导向、更有效地控制开支和成本。超过90%的新一代创业者拥有全球视野,从一开始就锚定全球市场——这正是中国风险资本的优势所在。 源码新十年,仍然年轻。我们将轻装上阵,守正创新;我们将保持耐心和好奇,永葆初心;我们将更老练,稳准狠,不废话,少走弯路,少做无用功。我...
从ChatGPT代表的文生文,到Midjourney代表的文生图,再到Sora代表的文生视频,Suno为代表的文生音乐,“暴力美学”在持续突破内容生产的天花板,多模态也成为了共识的发展趋势,下一个领域会是什么?在人类可视范围,可选的答案不多,更多人愿意押注在3D领域。 它代表了从元宇宙、XR设备、以及Apple Vision Pro 带来的持续期待,关于我们对内容消费体验的不断追求,关于人类自身未来生活的想象。 但3D赛道同时又似乎是目前尚未被巨头覆盖的领域,尚未有基石模型,一切尚在混沌,尚在迅疾发展,但也拉开一场争夺未来的赛马:是发布产品还是打磨技术?是不断迭代还是交付工业标准?是从图像开始还是3D原生?在这些问题的推动下,3D领域的技术在过去一年飞速迭代,甚至已经开始出清。 本文试图描述3D领域的技术发展路径,并通过不同玩家的产品和市场判断,尝试解答上述问题。 有意思的是,似乎当前在3D领域最有价值的工作,多数都是由华人完成的。有团队直白地告诉我们:图生3D的 Sora 时刻,会在中国发生。这真是令人兴奋的判断。 01 从谷歌DreamFusion 开始的升维路径: 从2D图像生成模拟3D模型 与图像和视频不同,人们在日常生活中单纯从视觉感知很少接触真正的3D信息。 因为人的双眼成像和立体视觉机制,导致人的大脑如此容易被骗,我们可以通过多种手段把2D信息做成3D感受,比如最近Sora 带来的视频,比如全景图片、球幕电影、3D电影、裸眼3D等多是如此。 而且,3D资产比2D复杂很多。2D的AIGC基本只有一种选择:生成像素。但是模型、贴图、骨骼、(关键帧)动画等都可以算作3D资产的一部分。而即使是最主流的3D资产——3D模型——其表示也分为网格(Mesh)、体素(Voxel)、点云、SDF、NeRF 等等。 一旦考虑到实际落地到渲染管线中,由于多年来产业发展的基础限制,基本上只有一种主流表示可以选择:Mesh。一个基本的Mesh大概如下图所示。由成百上千个或四方的,或三角形的面,共同构造出一个三维的物的各个角度。 图片来自Polygon mesh的维基百科 在非AI生成的情况下,这样的3D模型可以通过扫描生成,也可以由建模师手动生成。后期再进行对外部材质的贴图,呈现出一只可以用在游戏中的,或是蓝色卡通感的海豚,或是偏灰现实感的海豚。 虽然3D模型属于三维模型,但我...
没有什么其他的人造物像人形机器人这样,包含了人类的敬畏、赞赏和恐惧:我们期待它们让生活更方便和安全,但与此同时,我们却无法信任它们。我们如此细致地按照自己的样子塑造他们,但是与此同时,又如此担心它们会替代我们。 人形机器人曾经长期处于实验室阶段,但是近来有了新的转向——人形机器人开始能在实际环境中执行任务,并且与人类一起执行任务。 7月28日,谷歌DeepMind发布了一款新的机器人模型RoboticsTransformer2(RT-2),它是一个融合了视觉、语言、动作能力的多模态大模型。在超过6000次机器人试验中,研究人员通过将VLM预训练与机器人数据相结合,直接控制机器人。 通过对大量网络知识的预训练,RT-2模型产生的泛化和涌现能力,可以让机器人对从未见过的对象或场景上执行操作任务。 人形机器人的时代即将来临吗? 我们只花了几年时间就接受了iPhone智能手机带来的掌上虚拟世界,我们也会快速接受一个充满机器人的世界吗? 人类正在制造一些 终将代替自身的东西吗 2021年8月,在特斯拉AI日上,马斯克出乎所有人的意料,公布了特斯拉人形机器人(TeslaBot)项目。当时在现场只有一个模型和几页罗列了参数和概念的PPT,马斯克对机器人的市场定位是替代人类去做一些有危险,或重复枯燥的劳动。 在第二年的AI日上,这个PPT中的人形机器人在没有人工辅助和后背连线的情况下就走上了发布会的舞台,代号Optimus(和大家熟悉的变形金刚擎天柱同名)。接下来,马斯克播放了一段Optimus在办公室搬运箱子,给花浇水以及在特斯拉超级工厂中工作的演示视频。 Optimus的工作功耗是500w,配2.3KWh的电池,重73公斤。不包括手的自由度(能够独立运动的关节数)为28,手部有11个自由度,能够抓起9公斤左右的物体。计算设备来自特斯拉FSD自研平台衍生的SOC。 Optimus在研发上沿用了很多特斯拉在电动汽车领域已经取得的优势。机器人用的视觉深度学习模型来自特斯拉汽车;研发汽车所用的硬件仿真平台也为机器人的可靠性与结构设计提供了评估结果与优化支撑。马斯克在现场谈到Optimus的预期售价是2万美元。 今年的特斯拉AI日还没有到,但在5月的股东会上,马斯克再次展示了机器人项目的最新进展。 最新的特斯拉机器人行走的流畅度比Optimus有所提升;也能灵活地抓取放下物体。在技术方面...
在古希腊哲学家柏拉图的《理想国》中,有一个著名的洞穴之喻,描述了一群被困在黑暗洞穴中的人们,他们只能看到洞穴墙上的阴影,以为那是世界的全部。但是,有人因为某种原因走出了洞穴,看到了真正的世界,对于这个人来说,回到洞穴是一种不可想象的打击。而他若试图说服其他的洞中人,也是很难的任务。 这个故事让人们反思,我们真的了解自己所处的世界吗?或者,我们只是困在一座看似真实却实际上是幻觉的洞穴里,以为自己已经看到了全部? 当下,ChatGPT震撼了人们对人工智能的预期。就像柏拉图的那些困在洞穴中的人们一样,过去,AI可以分析一组数据并在其中寻找模式,但是算法无法真正理解语言的内涵和上下文,人们通过算法只能看到表面的阴影。但是,以ChatGPT为代表的AIGC,让我们相信一些重要的变化正在发生,也许人类即将走出这个看似真实但实际上是幻觉的洞穴。 我们正式推出AIGC的“尖峰系列”,呈现源码资本在AIGC领域的深度思考,分享科技和商业的前沿洞察。在伟大征程的起点,召唤更多人与我们同行。 此前,我们发布了《谁是AIGC的“大玩家”?》,从应用到模型、再到行业基础设施,全面总结和探讨了AIGC各环节玩家面临的情况。今天,我们进一步聚焦,从GPT的技术演进到LLM大模型,尝试回答为什么我们正站在AI应用指数级爆发的起点。 ChatGTP及相关应用用户趋势 01  GPT模型的技术演进路径 GPT是什么? GPT(Generative Pre-trained Transformer),是由OpenAI开发的基于深度学习的自然语言处理模型。该模型的核心是Transformer架构,它可以在大规模文本语料上进行无监督的预训练,即在没有标注数据的情况下,通过模型自身的学习能力,从大规模的文本语料库中自动学习到语言的规律和特征,进而应用于各种自然语言处理任务,例如语言生成、问答、文本分类、机器翻译等。 具体来说,GPT模型首先通过大规模的文本语料库进行训练,例如维基百科、BookCorpus等,从中学习到单词和句子之间的关系和上下文信息。这个过程是无监督的,即没有人工标注的标签和答案。 之后,GPT模型采用自回归语言模型(AR autoregressive),即预测下一个单词的概率分布,使得模型能够理解和学习文本中的语法和语义信息。 预训练完成后,GPT模型可以在各种自然语言处理任务中进行 fin...
在刚刚结束的这一年,以ChatGPT、Midjourney为代表的颠覆性AI应用,引发了AIGC的全球共振。 源码认为,这次生成式AI的浪潮背后可能会隐藏着巨大的机会。与过往深度学习浪潮不同,由于其更加庞大的模型规模,将参与竞争的门槛明显提高,小公司可能更倾向于直接适用服务而非搭建自己的模型,AI因此有机会成为一种平台型服务。同时,随着AI能力的进一步提升,AI应用也愈发靠近具体的商业场景,流畅自然的机器人对话、瑰丽超现实的图像生成,让普通个体也成为这场技术狂欢的一部分。 需要注意的是,与大多数技术一样,生成式AI在技术上的差异并不明显,但我们对其应用和商业前景保持希望,仍有可能出现十分有价值的应用场景。模型规模的扩大让传统的规模效应更加明显;同时,一个合适的产品形态和商业模式,可能催生额外的壁垒,比如足够的闭源数据。生成式AI通过优秀产品经理的打磨,亦可能将带来全新的体验,形成牢固的用户生态。 生成式AI作为一个可能有很高上限的底层技术变革,是一个十分值得认真关注的领域。 a16z投资人日前发布网站文章,从应用到模型、再到行业基础设施,全面总结和探讨了生成式AI各环节玩家面临的情况,并提出了非常有趣的洞察:训练了生成式AI并且将它们部署到实际app中的公司,创造了最大价值,但并没有在产业链中获得最大收益。 作为一项振奋人心的新技术,生成式AI产业链中的价值将如何演化?新的护城河是否会出现?谁才是这个领域的最大赢家? 源码编译此文与读者共飨,部分细节有表述调整,希望给您带来更好的阅读体验,启发更深刻的洞察思考。 01 提纲挈领的技术架构:基建、模型及应用 我们关注到,生成式AI领域出现了技术分工的早期阶段。 数百家创业公司正冲进来,开发基础模型,构建AI原生应用,建设基础设施或工具等等。 通常,热门技术被市场采用前,就被过度炒作透支了。但生成式AI的繁荣来自真实的市场收益,以及真实的公司推动。以人工智能驱动的文本转图像模型Stable Diffusion和自然语言对话模型Chat GPT为代表的这类模型,正获得爆发性的用户增长;同时很多应用在发布一年内,营收就超过了1亿美金。AI模型在一些任务中的表现已经超过人类好多个数量级了。 因此,有足够的信号显示,AI领域正在发生大规模的变革。但最关键的问题是:在生成式AI市场中价值将在何处出现? 我们通过与大量生成式AI公司...
5月11日,中国居住产业数字化服务平台贝壳正式在港交所挂牌上市,股票代码“2423”,成为首家以“双重主要上市+介绍上市”形式返港的中概股。11日上午,在遵守北京市防疫政策的前提下,贝壳于公司总部完成“云敲锣”。
1 2 3 21
分类阅读