00 前言
最近几年人工智能(AI:Artificial Intelligence)和大数据、智能驾驶等等新技术非常火爆。
其实人工智能已经有五六十年的历史了,前期多是一些理论性的研究,应用性的知识和技能还是非常少的。很清楚的记得,在20年前的2003年,在我大学课堂里,我们的计算机系的院长给我们讲人工智能课,早就忘了讲的具体内容了,当时听着云里雾里还有点忽悠人的感觉。转眼20年过去,已经有很多技术变成了现实。
比如2016年和2017年阿尔法go(AlphaGo)大战中韩围棋九段选手李世石和柯洁的经典例子;还有各种人脸识别技术,你是不是早就习惯支付宝的刷脸支付功能了;最近5年的自动驾驶技术也已经非常成熟了。
那2023科技界最靓的仔非ChatGPT莫属了。
01 那ChatGPT到底是什么呢?
Chat就是聊天;GPT是Generative Pre-train Transformer的缩写;它是一种基于Transformer模型的预训练语言模型,它采用无监督预训练的方式,最大特点是直接学习训练数据本身的特点,因而能更有效地学习大容量的样本,特别是海量的语言、视觉信息。像ChatGPT3,训练参数估计超过1750亿次以上。
那什么又是无监督预训练呢?
前提是要知道什么是有监督预训练,意思就是需要把训练数据提前做好标注。比如,训练机器人识别猫和狗,那需要提前人工在图片上做好标记,猫的图片是标记为猫,狗的图片标记为狗。当AI看了足够多的图片以后,也许是十万张,也许是百万张,就能准确分辨出哪个是猫,哪个是狗。看得越多,识别准确度也就越高,这个看的过程就是训练。
所以,与上面相反的无监督训练,就是没有事先人工标记猫和狗,而是告诉AI,猫和狗的参数,它们有很多共同的参数,比如四肢、尾巴、两只耳朵,有毛等等,但还有很多区别,比如猫爪有肉垫,眼睛会变化,尾长腰短等等,参数越多,就越能区分。
02 ChatGPT发展历程
其实很多人不知道的是,ChatGPT的母公司叫OpenAI。它是在2015年,由埃隆-马斯克(Elon Musk)、美国创业孵化器Y Combinator总裁阿尔特曼(Sam Altman)、全球在线支付平台PayPal联合创始人彼得·蒂尔(Peter Thiel)等硅谷科技大亨们投资10亿美元创立的一个非盈利性组织,主要是研究人工智能和智能机器人等。
在2019年,微软投资10亿美元宣布与OpenAI合作,开启了它的商业化之路。所以,只要有利益驱使,资本和资本家早晚都会嗅到其味道。
2022年11月底,人工智能对话聊天机器人ChatGPT3.5推出,迅速在社交媒体上走红,短短5天,注册用户数就超过100万。
2023年2月,推出的ChatGPT4,功能更加强大,在全世界范围内,一个月注册用户达到1亿。GPT-4是多模态大模型,即支持图像和文本输入以及文本输出,拥有强大的识图能力,文字输入限制提升到了2.5万字。
03 ChatGPT到底能干什么
除了简单的提问、聊天和对话外,ChatGPT的功能还是非常强大的,特别是在计算机等专业领域有非常惊人的效果。
自动编写文章
ChatGPT具备强大的文本生成能力,可以根据给定的主题、关键词或开头,自动生成结构合理、内容丰富的文章。这一功能可广泛应用于新闻撰写、博客创作、营销宣传等内容创作领域。
辅助编程
ChatGPT可以理解和生成编程语言,为程序员提供实时的编程帮助。例如,它可以解答代码相关的问题、提供代码示例,甚至帮助检查和调试程序。
教育辅导
ChatGPT可以作为在线教育辅导工具,帮助学生解答各类学术问题。它可以根据学生的问题和需求提供定制化的学习建议和资料,从而提高学习效率。
创意写作
ChatGPT可以作为一种创意工具,帮助用户进行故事创作、诗歌写作等。通过与模型的互动,用户可以激发灵感、拓展思路,创作出独具特色的作品。
数据分析
ChatGPT可以从大量数据和文本中提取关键信息,生成简洁明了的摘要。这一功能在商业分析、学术研究等领域具有很高的应用价值。
社交媒体管理
ChatGPT可以帮助用户管理社交媒体账户,生成吸引人的帖子和评论。它能根据用户输入的主题和风格,创建有趣、引人入胜的内容,提升用户在社交媒体上的影响力。
这些仅仅是ChatGPT主要用途的一部分,随着技术的不断进步,应用场景也会越来越多,涉及到各行各业。
04 ChatGPT的副作用
就像没有计算机的时代,人们写论文就只能去图书馆到处找资料;有了计算机,特别是有了网络之后,人们习惯了在网上寻找资料,大家都懒得去思考和创作了,就像很多人的毕业设计都是到处摘抄一样;人工智能也是一样,它让人变懒,而且它的答案也不完全正确,很多时候都有明显的错误,还是需要我们有分辨能力的。
在生成文本时,ChatGPT可能会重复某些表达或产生过长的句子。这可能导致输出内容显得啰嗦或者缺乏焦点。
由于训练数据来自于互联网,模型可能会从数据中学到一些偏见和刻板印象。虽然开发者努力减轻这一问题,但完全消除偏见仍然具有挑战性。
缺乏创造力和独创性:虽然ChatGPT可以生成流畅、自然的文本,但它的创造力和独创性可能受限于训练数据。它很难产生超出训练数据范围的新颖想法。
安全性和道德问题:模型有时可能生成不道德、有害或具有攻击性的内容。开发者需要通过技术和政策手段限制这些问题,但确保模型始终产生安全、合适的输出仍然困难。
如果你看过《流浪地球》系列电影的话,对于里面的人工智能“慕斯”你应该有印象吧?在《流浪地球2》中,操控一切反派的幕后大佬就是这个人工智能,它产生了自主意识,脱离了人类的掌控,完全按照他理解的最优答案去操控现代化系统,如果不是它没有动手能力,吴京饰演的刘培强最后可能也无法将它摧毁。
05 杂项
1 国内大厂的大语言模型
像百度的“文心一言”,阿里的“通义千问”,腾讯的“混元”,华为的“盘古”,360的“智脑”,科大讯飞的“”等等,都在如火如荼的发展中。
2 MidJourney: AI绘画
ChatGPT+MidJourney简直是无敌,比如你可以用ChatGPT提问生成文章的框架和细节,然后用MidJourney生成AI绘画,非常的酷炫,而且速度极快,10分钟就能搞定一个绘本的内容和插图。
3 ChatGPT抄袭
美国还有欧洲很多大学生都用ChatGPT写作业,导致很多大学都禁止使用GPT,但是越是禁止的东西,大家越感兴趣。
4 马斯克联名禁止ChatGPT
OpenAI的共同发起人埃隆·马斯克(Elon Musk)和一群人工智能专家及行业高管在最近的公开信中呼吁,在未来六个月暂停对GPT模型的训练,以免该模型变得更加强大,从而对社会和人类造成潜在风险。
5 超高成本,超级费电
ChatGPT训练需要非常多的GPU等芯片,成本极高;而且非常的消耗能源,每月的电量消耗高达150万美元,相当于1000万人民币。
6 国内网络不支持
目前,国内网络还不支持ChatGPT和Midjourney,只能“翻墙”,或者找国内替代的软件。
参考文章:
1 https://baijiahao.baidu.com/s?id=1763569840020284332
2 https://zhuanlan.zhihu.com/p/638022042
etc.
网友评论