智谱AI COO张帆:千亿模型是AIGC的船票,大模型将推动AI普惠
搜狐科技讯
5月17日,由搜狐主办的2023搜狐科技峰会在北京盛大开幕。今年,搜狐科技峰会走入第五个年头,峰会规格和内容再次迎来重磅升级。本届峰会齐聚多位院士、科学家、学者和头部企业嘉宾,共同探讨前沿科学与科技变革发展。
(资料图片)
峰会下午,智谱AI COO张帆发表了《大模型的探索和实践》的演讲。他认为,ChatGPT背后是大模型技术,只有做到千亿模型,才是AIGC的船票。
“机器跟人很像,人类的智能不是随着神经元做的线性增长,我们1岁时有一些基础智力,但到了3岁以后才开始快速成长,而且人类大概有800亿神经元。因此,当机器做到了千亿参数量,才开始接近人类。”
张帆认为,做大模型需要面临算法、算力的挑战,还需要数据经验。所谓名师出高徒,越好的数据,喂出来的模型越好。如果数据有问题,或者数据的价值观有问题,传导到模型后,将很难修复。
同时他表示,大模型有很多应用场景,比如文本生成、信息抽取等。“大模型可以进一步让AI普惠,可以更加低成本、快速地把AI应用到各种业务场景中”。
张帆在2023搜狐科技峰会上发表演讲
以下为张帆演讲全文:
首先大家能够看到今年被震撼的事件,就是ChatGPT用了两个月的时间,全球破亿用户的神话,特别是对比传统的技术,这个速度变得非常快。在ChatGPT背后的技术是什么呢?是一个大模型的技术,我简单罗列了一下大模型发展趋势。
大模型从2017年Transformer这篇论文出现,开始有了这个赛道,18年发布GPT-1开始,横轴是时间线,纵轴是参数量,越来越多的模型和越来越大的参数出现。智谱是比较早就关注到这个方向。
从19年公司成立就在关注大模型,那个时候没有那么火热,一直投入资源在做。一直到21年下半年,我们开始训练我们第一个希望能够普惠的千亿稠密的大模型,大概训练了8、9个月之后,到22年8月份发布第一个版本,并且开源出来,在国际社会上有很多正向的反馈。到了今年3月份,我们对标ChatGPT,出台了ChatGLM对话式模型反馈非常好。今年3月份,发布了6B小号的大模型更加普惠,甚至在单张游戏卡上就可以跑出来,一个多月的时间,全球有200万的用户,热度非常高的。
从最开始OpenAI有GPT-1、GPT-2,到GPT-3,有代码、网页指令等,到后面的GPT-4。我们去年8也许发布了千亿模型之后,也在跟进每个环节,我们有对应的对标,比如说代码模型、指令微调,让大模型遵循指令,Web及时获取真实信息,Chat更像是跟人聊天,按照这样的节奏,在今年3、4月份,基本上补齐3.5对标的逻辑,我们正在追赶GPT-4的逻辑。
为什么我们叫千亿大模型?它的模型参数从一开始1亿、10亿、百亿、千亿这样的流程,纵向是由机器生成一篇文章,让人判别,有多大概率是机器写的,判别这个事儿,最低线是随机猜,下面是50%的底线。随着参数量从1亿到千亿,每次增长人类越来越发现不了,这篇文章是不是机器写的,等到达千亿的时候,几乎人类已经很难分辨是机器写的还是人类写的,只有做到千亿模型,才是AIGC的船票。
为什么会产生这样的智能?其实很多研究中,很多的任务中,我们可以看到,随着参数量的变化,从百亿到接近千亿,甚至到大几百亿的时候,突然智能有快速的突增,这就是所谓的涌现,包括思考的能力、遵循指令的能力,推理的能力,都在很大规模才开始产生的。但是这个背后的原因虽然有各种各样的猜测和说法,也没有很明确的定论。
但是我们认为这个逻辑还是讲得通的。其实,人类的智能不是随着神经元做的线性增长,我们1岁的时候,有一些基础的智力,谈不上很聪明,到了2岁、3岁,结果到了3岁以后,开始快速具备智能,这些能力也不是线性的。所以我们觉得机器跟人很像,而且人有多少神经元,人类大概有800亿神经元,今天到了千亿参数量,开始接近人类了,至少接近一个数量级的情况下了,这是我们从大模型里看到的变化。
但是做大模型本身也是很难的,这个好比我们盖楼房一样,咱们盖五层楼和盖50层楼,不是一个线性关系,用的基础技术都不一样,5层楼用木头就可以了,50层楼要用到钢筋。
我们总结几个挑战。
第一个挑战是算法挑战。大模型精度非常高,它在非常复杂的计算的时候,我们本身是希望会逐步收敛起来,变成稳定的模型,现实当中,复杂精度训练当中,经常出现由于精度不够,代替梯度爆炸,模型突然训坏了,没有收敛了,而且爆炸了,这种情况非常常见。
另外一个是算力挑战。我们整个千亿130B模型的训练,纯的算力费用超过一个亿,这是去年的,今年所有的算力都翻倍,甚至更高,关键是买不到了。
另外就是数据上的经验。这通常就是大家所理解的名师出高徒,也就是越好的数据,喂出来的模型越好,如果数据有问题,或者数据的质量价值观有问题,直接传导到模型上,后面很难去修复。
下面简单介绍一下我们整体大模型矩阵,智谱有完整的大模型矩阵,我们全面涵盖了文本、代码、图像、视频,基本上对标OpenAI,我们有一个大号的大模型130B,到小号的大模型到6B,从基座模型到对话模型,以及应用端的代码模型,有文生图模型,还有CogVideo文生图视频,整个矩阵比较完整。
更关键的是大模型生产过程中,我们大多数人用的是GPT,而我们用的是GLM,百分之百自主知识产权的算法自研的,这个相当于一方面有把GPT单向模型的能力,只会单向预测出现的概率,到双向的,从文本中间抠掉字,通过两种特殊能力的结合,产生GLM的算法。我们明显超过GPT-3的水平,得益于算法本身从训练当中挖掘更多的知识信息。
讲一下我们具体模型特点,130B模型,1300亿大语言模型在去年8月份发布的,今年持续迭代,这个模型有几个特点,在去年8月份,我们率先把它做了开源,一个双语的模型,尤其在中文的数据集上有领先优势。
另外两个特色,第一个是无损量化,我们是极其少有的,我们能够用int4无损压缩大模型,每个参数用全精度32个位,现在变成4个位还不影响精度,它占据的空间非常小。另外我们全面支持国产信创,我们甚至有一些模型完全在华为的昇腾上面完成训练,我们对于国产的芯片都是有较好的支持。
另外分享一下,我们还有一个CodeGeeX,全球领先的多语言代码,我们在多语言模型上仅次于OpenAI,像Meta的,其他的开放平台,Salesforce都是胜出的,我们包装成中国的插件,也是对标GitHub,中国每天产生400万行的代码为我们的用户。另外在评测当中,有84%的用户都觉得它的效果是比较好的。
我们在过去一段时间,大概沟通有将近100家客户,在这个过程当中,我们不断的产生新的idea,让我们了解大模型如何应用到应用当中。每一次交互的变化,都可能对某一类需求产生洗牌的机会,我们更了解大模型,大模型应用场景非常值得关注。
我们选了几个常见的点,跟大家做简单的分享。
第一个文本生成。没有大模型之前,我们的文本生成基本上都是规则作为基础,都是以规则的拼接方式来做的,基本上很容易发现是人还是机器做的,而且它的影响面和应用场景非常小。现在模型大文本生成能力非常强,比如广告文案生成,工作当中周报的生成,新闻的生成,标书的生成,招聘的话,职位的生成,旅游的话,游记的生成,它的生成能力放在无数的地方,可能对市场的生态带来新的可能性,或者新的机会。这是一个非常好的场景。
第二个信息抽取。我们以前做信息抽取,基本上都靠NLP的方法,来打标,各种规则等等方法,其实它的泛化能力非常差,生产成本特别高,我们在一些客户需求抽取乐得长江,有一些销售戴着智能工牌,跟客户聊天有一万字的生成,我们提取用户画像,用户需求,甚至做客服的质检,有没有该说的话,不该说的话也说了来打分。如用传统的NLP的方法,则需要用两三个月的时间不断调整,而在今天大模型时代,它的生产成本,一个人搞半天就可以搞好了,在这种情况下,大模型进一步让AI普惠,在每个地方更加低成本、大家快速的把AI应用到自己的业务场景里面去。
再比如说信息检索,微软的New Bing,带来一种全新的模式。我们原来的搜索引擎,搜索完了之后,把10条结果全部要读一遍,看完要一个小时,大模型可以帮你完全看完,基于你的问题,针对性做回答,甚至还可以进一步做追问,这个体验会带来完全颠覆。这仅仅是网页,它本身内容密度比较高的。我们今天搜一个视频,往往只能得到封面或者是一个标题,你完全不知道自己查的内容在哪,如果把整个视频看了,半天就没了,大语言能不能把字幕里的内容提取出来,阅读完之后,转成对应的方式给我们,不再受制于展现形式。
比如说我们简历的检索,原来简历检索到这个人的职位和公司,它对于每一场项目经验的描述,我们没办法转化成语义,在今天有可能完全改变垂直领域,用户搜索的习惯和场景,这也是一个非常大的机会。在原来的方式里面做不到的。
比如说对话系统,原来对话系统,基本上以QA为基础,我们写好的问题,不够的话,我们不停扩展扩写,用各种各样的方法,非常生硬,稍微长一点的上下文理解不了,在大模型领域里面,有无数的场景,更好把对话能力植入进去,不断有更丰富的对话,即使QA里面没有,放一个用户手册,可以随便提问题,它了门槛、效果、上下文能力,泛化能力,远远超过之前的传统方法,包括我们在会议场景上做会议纪要,会议纪要直接变成排期,都是有机会。我们会看到仅仅在过去两个月时间,就见到无数这样的场景,一次一次被我们大模型能力惊艳到,它在各个场景里会出现越来越多的应用,这将是一个值得大家关注的方向。
见证过5G商用元年及其应用的爆发,探讨过AI技术发展与人文价值的平衡,搜狐科技峰会始终秉持媒体公共责任价值,宣扬求知探索的科学精神,聚焦前沿科学发展和技术创新应用。
本届峰会全新升级,重点聚焦更前沿的科学突破,展望人类更遥远的未来。从宇宙文明、天文卫星、人类永生,到核聚变、6G通信、脑机接口,再到通用人工智能时代启幕下的行业变革,以及青年科学家的价值守望和基础科学探索,都将是此次峰会关注的议题。
赓续探索精神,逐梦星辰大海。除本篇外,搜狐科技还将通过多种方式全方位呈现此次峰会嘉宾关于前沿科学与技术发展的洞见和思考。更多精彩内容请关注2023搜狐科技峰会专题报道。
【附专题链接】
PC端
WAP端
APP端
文章来源:顶端新闻
文章链接:https://static.dingxinwen.com/dd-sharepage/detail/index.html?id=4268328#/?categoryId=3
标签:
为您推荐
广告
- 智谱AI COO张帆:千亿模型是AIGC的船票,大模型将推动AI普惠
- 顺丰11.83亿“卖子”,极兔接盘再收一员 天天速看
- 产值60万!松滋石龙桥边蛙声一片
- 又到白蚁出没时节 家中发现白蚁可自行灭杀吗?-环球速讯
- 沈阳化工:公司暂未开通您所说的新媒体沟通平台
- 快播:金堂县镇村体系规划图
- 【天天速看料】新疆哪些出口产品更受欢迎?1—4月外贸进出口数据来了
- 小商品城完成发行10亿元超短期融资券 利率2.57%
- 恒指、恒生科技指数均跌超2%
- 上海:支持中小企业购买人工智能算力等服务 环球关注
- 每日热闻!百利电气(600468)5月17日13点0分触及涨停板
- 4月中国70城二手住宅价格环比涨幅全线回落 天天即时看
- 5月酒市有哪些看点?头部酒企品牌日争相发声 宴席市场唱主角
- 5月18日北京白塔寺免费开放通知
- 橡木家具的优缺点_橡木家具
- 首届中国制造品牌发展论坛 潘秋生:将中国美带给全世界_热资讯
- 世界关注:世界最大海上LNG接收站香港LNG项目试运行
- 7所高校联合发布高招政策 新增专业和扩招成高频词
- 航天器可重复使用缘何意义重大 不仅节约还更安全
- 内江电影院开门了吗_内江电影院
- 1天天动态:白璧微瑕瑕不掩瑜的意思_白璧微瑕
- 2今年一季度四川民营经济主要指标稳定向好
- 3德里克-罗斯:每晚都对布伦森赞叹不已 他打球坚韧不拔
- 4锦富技术(300128.SZ):厦门力富已成为宁德时代动力电池用气凝胶隔热产品的主要供应商之一-全球滚动
- 5肾功三项检查结果多久出来_肾功三项检查要多少钱
- 6宁夏神瑞工贸有限责任公司_每日速读
- 7游戏本值得升级到RTX4070吗?看完这两款笔记本,你就知道了 播资讯
- 8天天简讯:北京市市场监管局公布7批次不合格样品 涉及豇豆、生姜等
- 9世界观天下!吉利银河L7首搭神盾电池安全系统 创最安全新能源SUV
- 10qq坦白说怎么发消息给别人_qq坦白说怎么发|环球速递
- 1泉州首富女儿被绑架?被性侵20小时、索要800万赎金?假的-世界观焦点
- 2*ST商城:向关联方借款本金累计逾期6832万元 当前速讯
- 3金龙鱼董秘回复:公司会通过使用期货等衍生工具开展商品套期保值业务
- 4今日导读:市监部门回应“外卖5斤小龙虾实得2.9斤”;顾客吐槽知名火锅品牌推荐饮料不提费用;知名快餐品牌回应外卖可乐杯壁布满霉点(2023年5月16日)|世界快播报
- 5美元兑加元汇率今日预期趋势:横盘(2023/5/16) 快看
- 6权威部门隔夜两度发声:中国当前没有通缩,下阶段也不会通缩|天天最新
- 7环球新资讯:被问及选择谢菲联还是谢周三?F1车手周冠宇:皇马
- 8【天天播资讯】欧恩贝奶粉官网_欧恩贝
- 9达志科技第二条新能源电池生产线投产|世界滚动
- 10热门:写古诗牧童有哪些 小作者牧童写过哪些古诗?
广告
- A股:“以后再也不打新了”,新股慧智微上市破发,发行价才20.92元
- 今日关注:魅族20PRO评测:那个追求极致体验的魅族又回来了
- 开阳县禾丰乡:茶旅融合发展 赋能乡村振兴 焦点播报
- 下载的音乐如何转成mp3_如何在mp3上下载音乐
- 长沙一年新增18万常住人口 年轻人在这里找到坐标
- 【天天时快讯】独一无二,勇士总经理迈尔斯续约将会创造NBA历史纪录
- 海南省最大的休闲渔业交易中心交付 三亚新的旅游打卡地将“出圈”|焦点关注
- 国产全自研!腾讯“飞行模拟”发布:3A级渲染-全球快资讯
- cf限制登录人脸_cf限制登录
- 实时:荷兰菊花期-禾兰菊
- 环球最新:上海实业控股(00363.HK):5月15日南向资金减持1.8万股
- 【世界新视野】幸福树叶子发黄掉叶子是怎么回事(幸福树叶子发黄掉叶子怎么办)
- 实时焦点:【99组丨群像剧】RUNNING SHOT Vol.4
- 三一集团将实行轮值董事长制度
- 张明楷太皇太后是什么_太皇太后是什么意思_全球观天下
- 数据复盘:27亿抢筹能源金属 机构抢筹天齐锂业 头条焦点
- 北京今年迎来首轮高温 装企:对施工有一定影响,将采取防暑降温措施
- 我中国队长无弹窗_我中国队长
- 抗感染用药占比稳步增长 小分子药物销售量价齐跌
- 推动中国与中亚交往合作详细内容-观焦点