这是刘思毅宝宝总的 AI 专业访谈,这次访谈的嘉宾是是国内 AI 创业者顶尖前沿的创业者武彬,他的公司是用人工智能来做电商营销素材的,就是帮助所有的品牌跟电商卖家来做内容,公司现在市值几十个亿了。
武彬非常牛逼,清华本硕,计算机本科, NLP 人工智能实验室的硕士,他来回答我对于 AI 创业的一系列问题,十个问题快问快答。
一、你在清华的硕士读了什么方向啊?为什么可以融那么多钱?
武彬:首先我们这个背景就是在国内做 AI、 做算法,基本都是我们实验室的师兄师弟。
刘思毅:什么实验室啊?
武彬:大模型 NLP实验室。
刘思毅:NLP 有两个意思,一个是身心灵的骗子,一个就是人工智能的顶级模型实验室,NLP 模型到底牛逼到什么样子啊?
武彬:大家觉得对话是人类语言的皇冠,你思考很多问题都是基于语言来思考的。
比如说我邀请你参加一个活动,你会考虑这个东西参不参加,你脑子里的所有的逻辑都是一句话一句话想的,对吧?所以大家会觉得语言学是逻辑学的基础, NLP 他学了人类的语言的逻辑,也学了人类思考的逻辑。
二、AI 为什么在去年爆发式的增加?
刘思毅:是算力发生了变化还是算法发生了变化?
武彬:算法早都跑通了,在我读研 2019年的时候,Open AI的Transformer模型已经出来了。但是那个时候没有人验证出来 scaling law,比如你怼给他 100万 的数据,效果可能是 90 分,你给他 1,000万 的数据就是 100 分,就是类似于这个,你只要越多规模化,它这个效果就越来越好。
所以那个时候国外跑通了, OpenAI 就可能买了很多显卡,买了很多数据。因为它真的需要算力,算力是 base 在显卡的。
数据很重要,就之前相当于刘思毅你看了你的书产生了这个逻辑,我看了我的书产生了那个逻辑,现在相当于让一个大的大脑能把全世界所有的书都看完,他一定是比所有人都聪明的,但是我需要很多很多的算力才能容纳这么多书。
算力用于读取和容纳,你要快速把这东西看完,因此越快算力消耗越大。
刘思毅:你这个公司要买算力吗啊?
武彬:当然。
刘思毅:一个月要花多少钱买算力?
武彬:我们不算很多,可能是50万,在中国 AI 公司已经算非常低了。
刘思毅:那请问给我一个概念,文心一言和豆包要花多少钱?
武彬:每个月至少 5,000 万,他们现在还没有像 OpenAI 一样有订阅制赚钱,纯属烧钱,但是大模型又是未来的方向,这些大厂是一定要去做的。
刘思毅:但豆包我觉得它是容易赚钱的,因为字节有很多场景,就直接 membership 收费了。
三、你为什么有资格成为一个 AI 的创业者?
刘思毅:今天华人要做 AI 创业者,他需要什么样的能力?你就是典型的在中国大陆创业的华人 AI 创业者。
武彬:创业者目前就只有两种,一种就是跟我一样的,完全学 coding、 学算法的,你就是在其中的。
你就是 AI 赛道的一个学术领域有过学习的人类,而且基本上是顶级实验室学习的人类,你找一些应用方向,就可以创业。我有很多师生不想创业,他就喜欢科研,他觉得追寻人类知识顶层的皇冠不也很好吗?
第二类就是你这样的人。你是行业的人,就想解决数字孪生个人 IP 的问题。你找了一个非常好的 CTO,内部搭建把这个东西跑通了,就是在行业中有需求,找一个人来解决这个需求。
刘思毅:今天的 AI 创业需要科学家吗?或者需要的工程师素质吗?它和原先的 APP 时代请问是大同小异还是有根本的不同。
武彬:当然是有根本的不同的,它并不是说你一定要会开发,一定要会怎么样解决问题。因为你们想做的这个事,或者我们想做的事并不是最底层的算法的事情。最层算法是可能是 ChatGPT 或者是 OpenAI,他们感觉在编织一个世界。
刘思毅:算法科学家和工程建造师父有什么不同?
武彬:算法科学家就是不断地来调优这个模型。算法科学家最底层的能力就是数学的好,他就是解这些模型。
四、算法科学家到底如何创造了 GPT 对话模型的?
刘思毅:这个大模型它的步骤是啥?用人话说一说。
武彬:它解的就是一个更大规模的二元一次方程,二元一次方程不就是两个参数,但是你到更大的世界宏观参数,它可能有1万个答案,2万个答案,你就变成 1 亿个参数,
方程只有两个参数,就 x、y,但现在变成 1 亿个参数,算法科学家要解 一亿次二元一次方程。
有的人是来编这个网络的,他有的人可能他解决问题就是用更小的参数量把作用的效果做得更好,这样就少吃算力,有的人能解决的问题就是我用更大的参数量,但是用更少的数据。