ChatGPT 初体验

最近几天大家都在玩 ChatGPT，真的非常厉害，虽然不是万能的，但是这是第一个让我感受到不像人工智障的 AI 对话系统，对指代、记忆上下文等难题处理得也非常好。尤其是在编程问题方面，有时候比 StackOverflow 还好用。如果我的候选人表现成这样，我肯定会优先录用的。

目前 ChatGPT 主要的缺点是：

知识库更新不足、覆盖度不够全，不能回答最近发生的事件，不能回答比较偏门的知识。建议与搜索引擎或者知识图谱相结合，先用 prompt 词搜索出一些结果，然后再用 NLP 的方法把搜索结果整合起来。据说有一些研究团队已经在这个方向上努力了。
逻辑推理能力不足，稍微复杂一点的逻辑就很容易搞错，而且搞错了还回答得一本正经。如何解决任意复杂的逻辑问题是一个很大的挑战。能识别看上去正确但实质上荒谬的回答就更难了。
目前还只支持文本，不支持多模态。目前已经可以让 ChatGPT 生成 prompt，再输入到 DALL-E 里面生成图片。未来，支持多模态输入和多模态输出的生成模型将使人机交互更自然，可能成为下一代的人机交互范式。
单次回答的成本目前较高，需要数美分，显著高于一次 Google 搜索的成本。如果能通过算法或硬件的改进降低成本，或者与推荐、广告相结合产生新的商业模式，就能够有商业盈利的空间。

今年可以说是 AI 生成内容的 “元年” 了。前几个月我们都被 CV 领域的 stable diffusion（DALL-E 2）震撼了，现在 ChatGPT 又为 NLP 设立了新的 SOTA。Stable diffusion 和 ChatGPT 恰好都是 OpenAI 做的，OpenAI 的背后金主是微软，这也算是微软在 AI 领域扳回的重要一局了。前些年，一直是 Google Deepmind 的 Alpha 系列在抢风头，从下围棋到蛋白质、矩阵计算。

能跟人自然交流的智能助理是无数科幻电影中的场景，也是各大公司 20 年前就设立的 vision，今天终于看到了变成现实的曙光。智能助理可能孕育出下一个万亿美金级别的产业，就像移动互联网颠覆 PC 互联网、视频颠覆文字一样，成为新的人机交互范式，深刻改变人类的工作和生活。

以下是我在 ChatGPT 中尝试的一些例子：