焦点滚动:走下云端的大模型,能否再造一个万亿「英伟达」?
2016 年 9 月 13 日,一身黑色皮衣的英伟达 CEO 黄仁勋第一次将 GTC(GPU 技术大会)带来了中国,同时也展示了 GPU 计算不再局限于游戏,还应用在 AI(人工智能)、科学研究、自动驾驶以及 VR 等热门领域。
但最重要的还是 AI,黄仁勋在演讲中提醒所有人,「我们不再是一个半导体公司,而是一个 AI Computing Company(AI 计算公司)。」
同一年,谷歌在 I/O 大会上提出「AI 为先」的战略,往后每年都要一遍又一遍地强调,并将 AI 越来越多地融入自家的产品之中。微软也第一次宣布携手 OpenAI「履行普及且全民化人工智能的使命」,那篇新闻稿在开头就写道:「我们正处于技术发展历程中的关键时刻。」
(资料图)
图/微软官网
这是一个时代的序幕。
七年后,生成式 AI 带来新一轮的革命,ChatGPT 在全球范围颠覆了大众的认知。而伴随着 AI 热潮的持续爆发,英伟达的股价从去年 10 月的 112.27 美元涨超 400 美元,成为了有史以来第一家万亿美元市值的芯片公司,在全球仅次于苹果、微软、Alphabet(谷歌)和亚马逊这四家公司。
今日之成功非今日之功。今天 AI 领域最重要的 4 家公司,在 2016 年共同迈出了走向 AI 未来的关键一步,也坚定了「AI 改变世界」的决心。那一年发生了什么,大部分人都知道—— DeepMind(谷歌旗下)推出的 AlphaGo 与人类棋手李世石的世纪对决吸引了全球的目光。
AlphaGo 将 AI 重新拉回到人们的视野之中,却没有在实验室之外真正改变人们的生活。即便是 2018 年发布的 Transformer(也就是 GPT 中的「T」)深度学习模型,也要等到 ChatGPT 的横空出世。
而现如今,无数人都可以断言 AI 开始真正地改变世界:
- 研究人员利用 AI 技术快速筛选出了能杀死超级细菌的新型抗生素,上海市科委也说要围绕 AI 药物设计进行布局;
- 生物公司在像英伟达 CEO 黄仁勋所说的「借助 AI,学会理解蛋白质」,晶圆代工厂也在利用 AI 提高生产效率;
- ChatGPT 之外,搜索、Office 文档、笔记、社交媒体……更多的公司和开发者正在将 AI 应用于各种生活和工作场景之中。
留给 AI 的挑战当然还有很多,生成内容的归属、恶意滥用(比如诈骗)以及一本正经胡说八道的「幻觉」等等。但在所有挑战中,最关键的可能还是如何让生成式 AI 更安全的同时,扩大使用场景,降低普通用户的使用门槛,使得更多的人可以利用 AI 得到更高的生产效率,享受更好的生活。
AI 技术的扩散,或许就是下一个七年甚至几十年的最大机会。
AI 大模型不应只「活」在云端
半个多世纪前的 1946 年,世界上第一台电子计算机 ENIAC 诞生了,从此人类一只脚迈入了计算机时代。
但直到 PC(个人计算机)在 1982 年真正推向市场之前,普通人其实触碰不到计算机给生活带来的变革,而 PC 作为第一代个人计算平台在诞生之后的几十年,彻底改变了所有人的生活,也衍生出了一系列今天至关重要的产业,包括但不限于互联网、芯片以及智能手机。
IBM 5150,图/ Wikimedia Commons
人类的技术史不断在证明一件事——技术创新很伟大,但技术扩散同样伟大。印刷术的出现对于整个人类文明的重要性不言而喻,但印刷术在北宋以降的扩散,以及文艺复兴时期在西方世界的扩散,一样无比关键。
然而当下几乎所有生成式 AI 应用都跑在昂贵的数据中心,比如最热门的 ChatGPT 就跑在微软 Azure 的全球数据中心里。与此同时,数据中心也限制了生成式 AI 在更大范围内的落地。
贵是一方面,就连当下最炙手可热的 OpenAI CEO Sam Altman 也说,OpenAI 目前的首要任务是降本增效,更何况是从去年就开始喊的一众互联网公司,普遍都面临成本的压力。
Sam Altman,图/ Steve Jennings
而且随着更多用户更频繁的使用,AI 的运营成本还会水涨船高,关键是对大部分互联网的商业模式来说,企业其实很难向用户直接收取高昂的费用。另一方面,生成式 AI 的应用并未成熟,大部分用户也不太可能接受高昂的收费模式。
除此之外,隐私安全的重要性现如今越来越受到重视,很多人不再愿意把自己的照片、视频上传到网络,反而倾向于存储在本地,比如苹果为代表,更多的企业都在面向用户强调产品的隐私安全。而企业本身对数据安全的重视更是如此。
之前三星半导体部门的员工在使用 ChatGPT 的时候,就把一些数据上传到云端,导致商业机密泄露,不仅是三星在内部重新实施了 ChatGPT 禁令,也引起了不少公司对 ChatGPT 的警惕。
同时 AI 作为一种基础设施,未来应该被所有人使用,使用场景也将极其广泛,包括轻负载和重负载场景,也包括对延时比较敏感的场景。而从数据传输到云端处理,再回传结果,其中必然会有网络延时的影响,一些 AI 任务可能不需要过高的加速性能,反而要求更低的延时。
一言以蔽之,来自云端的算力无法覆盖更多的 AI 使用场景,也满足不了更多人的 AI 使用需求,AI 不应该只「活」在云端。
微软数据中心(2010 年),图/ Robert Scoble
在 ChatGPT 之后,很多人就提出了一个构想——每个人都可以拥有专属的 AI 助手以及背后的语言模型。印象研究院院长常诚之前接受雷科技采访时就说到,印象 AI 未来一个可能的发展方向就是结合印象笔记作为知识管理产品的定位,让每一个用户可以选择用私人语料训练和部署自己的专有语言模型。
但从成本、隐私和延时等不同角度来看,一个云端的 AI 并不合适。而在更广泛的 PC,以及几乎人手一台的智能手机上,我们还有大量的晶体管和算力,足以接下来的算力变革中创造一个更多元、更庞大的 AI 生态。
本地加速,AI 大模型上终端
5 月底,英伟达公布了最新一季财报,在游戏和专业可视化收入继续大跌的背景下,数据中心收入达到创纪录的 42.8 亿美元。电话会议上,黄仁勋解释说:
计算机行业正在同时经历两种转变——加速计算和生成式AI。随着各个公司竞相为生成式AI部署加速计算,价值1万亿美元的全球数据中心基础设施将从通用计算转向加速计算。
事实上,这种转变不仅发生在数据中心,还发生在全世界的 PC 和智能手机上。早前的一场媒体会上,英特尔就在一台轻薄笔记本上展示了通过本地运行 Stable Diffusion 生成图片的过程。
英特尔的演示,图/英特尔
英特尔客户端计算事业部终端生态合作亚洲区总监高源透露,新一代 Meteor Lake 处理器将会集成 CPU、GPU 以及专门面向 AI 加速的独立计算单元 VPU。不仅如此,CPU、GPU 以及 VPU 将共同参与 AI 加速计算的过程,使得在轻薄型 PC 成为可能。
与此同时,微软和谷歌——两家走在时代潮头的操作系统厂商也在系统层面引入生成式 AI。微软先前宣布将在 Windows 11 上率先推出 Windows Copilot,成为第一个加入生成式 AI 助手的 PC 操作系统,本月就会推出预览版。
谷歌还要更进一步,计划在手机上率先内置 AI 语言模型。为此谷歌通过大模型「降参数」得到小模型,实现了更低的算力要求和功耗,在上月的 I/O 大会上就推出了四个版本的 PaLM 2,其中 PaLM 2「壁虎」作为羽量级版本可以直接在 Pixel 手机上离线使用,每秒处理 20 个 token。
PaLM 2 Gecko(壁虎),图/谷歌
无独有偶,荣耀 90 系列发布的会后采访环节上,荣耀总裁赵明也表示,相比云端的大模型,手机端 AI 更为强调个性化和安全,荣耀将在端侧 AI 上进行发展,「未来端侧 AI 与大模型会有某种程度的结合。」
说到底,终端 AI 也不是要代替云端 AI,更多是为了覆盖所有人的所有使用场景和需求,大模型运行在手机和 PC 本地,比起云端延迟更低,离线运行也可以更好地保护用户隐私。
在前不久结束的 Computex 上,高通资深副总裁暨运算及游戏部门总经理 Kedar Kondap 说,考虑到延时、效率和实用性等问题,部分计算于手机、平板或电脑中、部分则在云端运行,「未来的 AI 计算是混合的。」
从芯片到终端厂商都意识到了,终端算力正在从通用计算加速转向 AI 加速计算,不仅是 NPU(神经网络处理器)变得越来越重要,CPU 和 GPU 也可能将更多的通用算力转向加速计算。过去更多用在图像处理上的加速处理能力,未来将覆盖生成式 AI 的方方面面。而全球每年卖出的数十亿台手机和 PC,也会把 AI 加速计算的能力源源不断地带给每一个人。
换言之,不管是英特尔演示用的轻薄本 PC,还是谷歌不久后的新 Pixel 手机,都只是一个开始。我们不难想象未来在手机和 PC 上可能都会预装一个「小模型」,用户可以随时随地安全且高效地使用专属的 AI 助手。
图/ PxHere
而终端和云端,大模型和小模型的协同也会进一步推动 AI 的快速进化。大模型向搭载在设备端的小模型输出能力,小模型则在大模型的基础上负责感知、推理和执行,再将执行的结果反馈给大模型,让大模型的知识与能力持续进化,形成一套有机循环的系统。就像阿里达摩院说的:
参与者越多,模型进化的速度也越快。
AI、人类和个体
在科幻小说《造神年代》里有一段描述:面对全世界股市发生的混乱,男主在网吧通过万国宝(小说中阿里开发的翻译 AI)向一位苏格兰友人大吼「活下去!奇点就要到了!」紧接着作者写到:「就在刚才,时代已经变了。他们还不知道。」
因为就此,强人工智能万国宝获得了新生,有了根指令和初始本能,接下来将以全球为战场,在与谷歌(小说中另一个强人工智能巨兽)和人类的三方战争中努力「活下去」。
但在现实世界中,即便是公认最领先的 GPT-4 距离强人工智能(或称通用人工智能)也还有很远。而且技术总是充满了两面性,AI 或许拥有威胁人类未来的可能,也有帮助人类打造更美好世界的可能。
网景浏览器和传奇创投公司 a16z 创始人马克·安德里森(Marc Andreessen)过去多次写过预言式的雄文,包括《软件吞噬世界》《是时候开始建造了》,不久前他又写了一篇《为什么 AI 将拯救世界》,其中一个核心的观点是:AI 通过增强人类智能,帮助人类像过去几千年一样创造更美好的世界。
或许安德里森的观点过于宏大和抽象,但当我们聚焦在 ChatGPT 上就会发现,生成式 AI 技术最具革命性的部分在于自然语言输入。
「计算机可以像人类一样说话吗?」图/ YouTube@TED
过去人类只能通过命令行与计算机进行交互,输入指令来获得结果,后来图形用户界面的出现,与计算机的交互变得更加直观,手机触屏则在鼠标和键盘的基础上,进一步降低了用户的使用门槛。ChatGPT 告诉我们,人可以通过自然语言——平常和同事、亲人说话的方式,与计算机进行沟通,并且计算机有能力同样以自然语言的方式告诉我们(结果)。
另一方面,没有人可以穷尽所有的知识,哪怕掌握再多的生产力工具和技巧,构建再多的「第二大脑」。但理论上计算机可以输入人类有史以来保存的所有知识,ChatGPT 就几乎「遍览」了互联网上所有公开知识,并且跨越社会语言文化,用最底层的逻辑关联所有知识。
结果就是 ChatGPT 虽然还有很多「幻觉」,却是无可争议的博学,同时还一举超越 NLP(自然语言处理)技术,不同语言之间的翻译效果也甚于过往,以至于粤港澳大湾区数字经济研究院-认知计算与自然语言研究中心负责人张家兴博士在 ChatGPT 出现后感叹:「(传统的)NLP 技术不存在了。」
于人类而言,ChatGPT 最直接的意义就是提供了一位学贯中西的数字助理,帮助我们越过无数的(语言、文化、技术)障碍,直接了解散落在互联网的各种信息和知识,也可以与之进行情感上的交流。但就如前文提到的,出于隐私的顾虑和使用的体验等各种因素,如果我们想要更进一步,让 AI 更了解每个人之后进行个性化的微调,同时管理更多私人的任务和内容,就不可能完全依赖于云端的算力和模型。
所幸过去几十年,高性能个人计算终端—— PC 和手机飞入寻常百姓家,算力和功耗的挑战当然还在,但事情已然迈出了关键一步。
标签:
抢先读
- 焦点滚动:走下云端的大模型,能否再造一个万亿「英伟达」?
- 希望与挑战:揭秘18A“医美”第一股_环球视点
- 信用卡安全码泄露怎么补救呢?信用卡换卡要注意什么?_世界播报
- 10分钟内连丢3球 中国男足亚运队1:3不敌韩国U24队 环球观热点
- 怪生无雨都张伞的下一句是什么?_怪生无雨都张伞的怪生什么意思
- 液冷概念股震荡走高,飞龙股份拉升封板
- 天合光能2亿元于盐城投资新设科技公司|世界播报
- 好未来开放小学数学知识图谱
- 全球实时:俄官员:西方在全球经济领域影响力下降
- 工控速递:西门子宣布新加坡建厂,中控斩获中东船务大单,三菱供应全SiC功率半导体,禾川上市光电传感器-观速讯
- 勇敢是什么词性?勇气和勇敢的词性区别
- 西北工业大学出版社与施普林格·自然集团战略合作签约仪式在北京举行_当前滚动
- 焦点简讯:看图学习·乡村之美丨让农民就地过上现代文明生活
- 淘宝618上线“星生代”会场10天 吸引超过280万人线上逛街 当前资讯
- “花式”科普 暖心守护知感冒防流感全民科普公益行走进青岛-快资讯
- 十堰职业技术学院联系方式 十堰职业技术学院|每日精选
- 阿里总裁:马云现在主要生活在中国 集团未来主攻海外
- 信用卡到期换卡会查征信吗?信用卡到期换卡被拒怎么办? 今日报
- 最新快讯!真这么烧钱 《花花公子》创始人之子 卖私人照片投资宝可梦
- 【环球快播报】硅业分会:本周国内工业硅期现价格均延续下行态势 但有望短期内止跌企稳
- 快手电商上线“短视频挂店铺”功能,全面推进内容场与货架场联通 全球新要闻
- 两江新区翠云社区卫生服务中心获国家部委通报表扬
- 蓝色协议如何联机
- 售29.80万元起 蔚来ET5 旅行版正式上市
- 协议投资总额达225.4亿元!常州这些项目签约、开工! 焦点短讯
- 城乡居民养老保险怎么交(城乡居民养老保险怎么交划算)_全球今日讯
- 什么是无罪推定原则定义?无罪推定原则的具体内容有哪些? 独家
- 阴阳师上美影联动皮肤上线 一期暴涨二期值不值得买? 天天最新
- 叶县张永定:吃苦耐劳“老黄牛” 坚守环境整治一线 全球时讯
- 昆明市第十五幼儿园开展“主题活动与区域活动融合的游戏设计与组织”教研活动-每日头条
- 环球观察:欧盟评估一种6'-唾液乳糖钠盐作为新型食品的安全性
- 安家费最低50万!中原食品实验室将重点引进这四类人才_看点
- 2023呼和浩特赛罕区第八幼儿园现场材料审核通知
- 天天热头条丨2023工业互联网大会专家谈 张倩:守好工业互联网安全“主阵地”
- 中科信息:目前没有从事脑机接口技术与设备研发 |环球热闻
- 美联储6月加息落地,南方基金解读来了|世界看热讯
- 全球动态:郑州中国移动2023暑期实习招聘信息
- 2023洛阳自产瓜果直销点设置最新消息 洛阳瓜果批发市场|最新资讯
- 全球观察:cad怎么导出pdf格式黑白(cad怎么导出pdf格式)
- 最新!比尔盖茨回复黄晓明 环球速讯
- 世界微头条丨为汽车消费充“电” 为乡村振兴添“绿”!2023年新能源汽车下乡活动启动
- 毁灭新生?这款暗黑续作究竟能否逆风翻盘?
- 英特尔处也能「Ultra」:命名大改,标识焕新
- 法务部出手!盗版王国之泪社区被老任投诉关闭
- 下周端午!这份高铁短途“逛吃”攻略请查收
- 环球播报:炸沙丁鱼干粉好还是湿粉好?
- 环球实时:第三届“北京市公益创投大赛”启动,申报主体须无不良记录|环球微头条
- qq便签在哪里找(qq便签不见了)_报资讯
- *ST新海(002089)6月16日14点18分触及涨停板
- 民间借贷多久结案起诉
- 速读:我国经济运行保持恢复态势 重点在六方面发力
- 【天天快播报】稳供电 保供水 上海市水电部门为迎峰度夏保驾护航
- 全球快资讯:钻石一克拉多少钱人民币?钻石一克拉是几克?
- 全球热点!储能与电力设备周报(第2期):广东市场加速,装机旺季将至
- oppoa57t高清语音怎么开通(oppoa57t) 重点聚焦
- 电脑系统分盘怎么分?电脑系统分盘怎么合并 要闻速递
- 热议:网贷债务逾期被起诉怎么办?网贷为啥只催收不起诉
- 望穿秋水是什么动物_望穿秋水描述什么动物
- 环球滚动:厦门方特端午节晚上有营业吗?
- 全球播报:三角形符号图案大全(三角形符号)
- 外围油脂上涨提振,中国棕榈油飙涨
- 世界热文:交易员看衰全球经济和需求端 原油易跌难涨
- 蒙城三义镇:织密秸秆禁烧安全网
- 《碧海黑帆》Beta封测主机版被取消 现仅限于PC端
- 【环球时快讯】湾里管理局中考考点设置及周边交通提示2023
- 今亮点!未成年人游戏陪玩该不该管?该如何管?
- 国乒26岁悍将击败达科,单打8人冲击8强!混双抗韩,男女双迎内战
- 从u盘拷贝的3dmax怎么安装(3dmax怎么安装)
- 全球观点:海蟑螂能吃吗?蟑螂会靠近熟睡的人吗?
- 江阴学费补贴怎么领?
- 亚运会的运动员村什么样?先睹为快
- 福特与通用称美国汽车需求迎来提升 环球实时
- * 创业板指涨幅扩大至1% 世界速看料
- 观察:美国“俄亥俄”级核潜艇驶入韩国港口
- 实时焦点:试车日志|静态体验大众朗逸新锐 10万元燃油车再添一员
- 速讯:我国首艘海陆一体化生产运营的智能“海上油气加工厂”在南通交付
- 2023年浙江金华中考作文题目点评解析(四)
- 天天观点:有调整!事关丽水人的医保
- 微资讯!彭州南部新城吧
- 云浮市气象台发布暴雨黄色预警【III级/较重】【2023-06-16】
- 11岁的小女孩生日礼物
- 38只个股5日量比超过5倍
- 焦点快播:DEHN参与主编的耐高压绝缘引下线(HVI)产品标准 GB/Z 33588.8—2022 发布实施
- 6月16日A股分析:三大指数集体收涨,CPO、数据要素概念强势
- 全球微头条丨全民健身,振兴突破!辽宁省第十四届运动会今晚盛大启幕
- 世界热头条丨板块轮动是什么意思?股票板块轮动快的原因是什么?
- 淘宝秒杀在哪(淘宝秒杀怎么能秒到)|全球今亮点
- 每日快讯!金华时光整形医院医生技术实力、口碑点评一览!
- 时讯:青藏线失联近一个月的货车司机遇难,遗体在附近河道被发现
- 每日资讯:KK一夏 端午粽香特惠
- (高质量发展调研行)连云港港:开港90年 开通全球86条集装箱航线
- 双色球23069期红蓝定胆推荐
- 世界观热点:全球首发 蜂巢能源超薄户储CP亮相慕尼黑太阳能光伏展
- 能链智电于翔:储能技术推动新能源充电服务升级转型
- 天津开设AP的学校有哪些?-天天热闻
- 智能园区智能制造,台达“智慧永续产业园区”COMPUTEX 2023盛大登场
- 环球动态:液冷概念股震荡走高,飞龙股份拉升封板
- 货币供应量是什么意思?货币供应量增加会导致什么? 世界视点
- 美国疾控中心:枪支暴力推波助澜 青少年谋杀率飙升 天天观焦点
- 环球精选!民泰银行柯桥支行:“蔬”通“配送”路,“鲜”至客户心