当前位置:首页>生活 > 同一模型完成多场景任务 人工智能大模型或加速技术落地

同一模型完成多场景任务 人工智能大模型或加速技术落地

首先是要关注训练数据的质量,目前一些模型具有的偏见其实都是由于训练数据本身所引发的。第二,要加强对算法本身及模型内部运作机制的研究。此外,模型的训练过程中,要加入多模态的数据,通过多模态信息内在的多重关联性降低大模型“偏执”的概率。——黄铁军 北京智源人工智能研究院院长

近日,美国斯坦福大学李飞飞等百余位学者联名发布《基础模型的机遇与挑战》一文,论述在人工智能基础模型成为趋势的环境下,其发展面临的机遇与挑战。文章指出,基础模型的应用使得自监督学习+预训练模型微调适配方案逐渐成为主流,并带来了智能体认知能力的进步。但同时由于基础模型的任何一点改进会迅速覆盖整个AI社区,其隐患在于基础模型的缺陷也会被所有下游模型所继承。

斯坦福大学学者谈到的基础模型,国际上也称预训练模型,也被国内研究者称为大模型。那么,什么是人工智能大模型,与小模型相比有哪些优势?为何大模型会成为趋势,在行业中有哪些应用?未来又面临怎样的机遇和挑战?

像发电厂一样不断供应“智力源”

大模型成了最近AI产学界刷屏率颇高的词汇。需要更大算力、更大数据集的大模型,为何可能是未来AI最好的伙伴?这要从AI开发者们的一次次挫败与碰壁说起。

深度学习技术兴起的近10年间,AI模型基本上是针对特定应用场景需求进行训练的小模型。小模型用特定领域有标注的数据训练,通用性差,换到另外一个应用场景中往往不适用,需要重新训练。另外,小模型的训练方式基本是“手工作坊式”,调参、调优的手动工作太多,需要大量的AI工程专业人员来完成。同时,传统模型训练需要大规模的标注数据,如果某些应用场景的数据量少,训练出的模型精度就会不理想。

“小模型的这些问题,导致当前AI研发整体成本较高,效率偏低。由于AI人才短缺以及成本昂贵,对于中小行业用户来说,小模型的这些问题阻碍了行业用户采用人工智能技术的脚步,成为AI普惠的障碍。”北京智源人工智能研究院院长黄铁军在接受科技日报记者采访时指出。

虽然,之前全球呈现“千村万户大炼模型”的热闹场面,但这种“自家炼钢自己用”的作坊方式显然不符合现代产业发展规律。

黄铁军进一步解释道:“大模型可以解决这些问题,其泛化能力强,可以做到‘举一反三’,同一模型利用少量数据进行微调或不进行微调就能完成多个场景的任务,中小企业可以直接调用,不需要招聘很多AI算法专业人员就能进行应用开发,显著降低中小企业的研发门槛,促进AI技术落地。”

得益于这些优势,人工智能的发展已经从“大炼模型”逐步迈向“炼大模型”的阶段。以美国OpenAI、谷歌、微软、脸书等机构为代表,布局大规模智能模型已成为全球引领性趋势,并形成了GPT—3、Switch Transformer等千亿或万亿参数量的大模型。可以说,人工智能大模型时代正在到来!

“人工智能大模型是‘大数据+大算力+强算法’结合的产物,是集成大数据内在精华的‘隐式知识库’,也是实现人工智能应用的载体。大模型是连接人工智能技术生态和产业生态的桥梁,向下带动基础软硬件发展,向上支撑了智能应用百花齐放,是整个人工智能生态的核心。”黄铁军表示。

北京智源人工智能研究院理事长张宏江博士指出:“未来,大模型会形成类似电网的智能基础平台,像发电厂一样为全社会源源不断地供应‘智力源’。”

通用智能应用前景广阔

类比人的教育培养,大模型所完成的培训就如同基础性、通识性的大学本科培养,“学成”后的大模型具备处理一般事物的能力。如果要完成更专业、更高级的任务,大模型还需要“研究生”阶段的专业培养。

黄铁军进一步指出:“AI大模型通常是在大规模无标注数据上进行训练,学习数据中蕴含的特征、结构和知识。”

在这一趋势下,北京智源人工智能研究院2021年3月发布悟道1.0,是中国首个人工智能大模型,取得多项国际领先的AI技术突破;2021年6月发布的悟道2.0,参数规模达到1.75万亿,是OpenAI的GPT—3模型的10倍,一跃成为世界最大模型。

北京智源人工智能研究院学术副院长、清华大学教授唐杰表示,大模型可以包含更多数据,表示更多信息,模型往超大规模发展是一个必然的趋势。

“超大规模预训练模型的出现,很可能改变信息产业格局,即基于数据的互联网时代、基于算力的云计算时代之后,接下来可能将进入基于大模型的AI时代。”唐杰认为。

据介绍,超大规模智能模型的通用智能能力在医疗、金融、新闻传播等行业应用前景广阔。例如,在医疗健康领域,大模型在医疗数据格式化、病历自动解读与分析、自动问诊系统等方面都可以发挥巨大效用。在金融、法律、财务、人力资源、零售等传统行业领域,大模型能提供高性能的智能信息解析和提取、智能数据整合、自动机器翻译、辅助决策等功能,提升业务流程效率和水平。在新闻传播领域,基于模型可实现智能新闻线索收集、机器写作、辅助编辑、虚拟主播等应用。目前,智源悟道大模型,也在为北京冬奥会提供新场景下的人工智能服务应用;并正在通过大模型开启手机AI语音技术新路径,赋能智能终端新一轮AI体验革新。

同质化和涌现特性带来机遇与挑战

最近,斯坦福大学数十位研究者联名发表《基础模型的机遇和风险》综述文章,认为大模型的特点之一是“同质化”,好处在于大模型的任何一点改进就可以迅速覆盖整个AI社区。但同时,它也带来一些隐患,大模型的缺陷会被所有下游模型所继承。特点之二是海量数据训练出的基础模型具有“涌现”特性,也就是产生未曾预先设想的新能力,这种特性有望让AI具备处理语言、视觉、机器人、推理、人际互动等各类相关任务的能力。因此这类模型将赋能各行各业,加快行业的智能化转型,在法律、医疗、教育等领域都会带来具有社会价值的影响。

但同时,如何应对大模型下游的传播问题,进一步提高信息的精准性与适用性,以人工智能大模型技术激活各行各业?

黄铁军回答道:“这是学界现在所面临的共同难题,未来应该从几个方面来减轻甚至消除这类影响:首先就是要关注训练数据的质量,目前一些模型具有的偏见其实都是由训练数据本身所引发的,因此我们要在数据源头上做好保障,既要量大,也要质高。第二,要加强对算法本身及模型内部运作机制的研究,目前深度学习算法的可解释性等理论还在探讨阶段,对大模型的理论分析和缺陷查找能力提出了更大挑战,这就需要加强基础研究,以支撑大模型在那些可靠性要求更高行业中的应用。此外,模型的训练过程中,要加入多模态的数据,比如文本、图片、视频等类型的输入,通过多模态信息内在的多重关联性降低大模型‘偏执’的概率。我们常说人要‘行万里路,读万卷书’,大模型也一样,会随着算法的改进和‘阅历’的增加越来越智能。”

为您推荐
  • 广西一新娘,因“长得太美”而火出圈,网友:山窝里的金凤凰!
    2024-03-15
    在广西某个幽静的村落,一场盛大的婚礼成为了村民们茶余饭后的热议焦点。婚礼之所以如此引人瞩目,不仅因为它洋溢着浪漫与温馨的气息,更因为新娘那令人惊艳的容貌,仿佛一位踏月而来的仙女,让在场的每一个人都为之倾倒。新娘名为小梅,是一位土生土长的广西姑娘。她那双清澈明亮的大眼睛,宛如山间的一泓清泉,灵动而深邃。她那弯弯的眉毛,如同柳叶一般婀娜多姿,映衬着白皙如玉的肌肤,更显清丽脱俗。当她笑起来时,那灿烂的笑
  • 接连签约!南通将新增一批打卡地
    2024-03-15
    为全面落实全市“重大项目攻坚突破年”部署要求,2024年开年以来,全市文广旅系统主动作为、强势开局,推动文旅市场加快复苏,重大文旅项目如“春花绽放”般签约。截至目前,新签约文旅项目7个,总投资额24亿元。项目详情滨海酒店项目签约时间:2024年1月签约地点:启东市投资金额:10亿元项目介绍:滨海高端度假酒店项目位于启东市江海澜湾旅游度假区,由上海长甲集团投资建设,总投资10亿元,占地约370亩,将打造集高端度假酒店
  • 四川五日游旅游路线,四川游哪些美食,来四川如何规划行程
    2024-03-15
    四川,简称"川"或"蜀",省会成都,位于中国大陆西南腹地,自古就有"天府之国"之美誉,是中国西部门户,大熊猫故乡。四川今与重庆、贵州、云南、西藏、青海、甘肃、陕西诸省市交界。四川东部为川东平行岭谷和川中丘陵,中部为成都平原,西部为川西高原。这次出游是朋友推荐的一位四川当地旅行规划师小雅安排的,没有任何自费项目!从接站到住宿、交通、吃饭、门票等都是小雅安排,十分省心。真心推荐
  • 夫妻关系如何维持?寻找专属于你的婚姻幸福之路
    2024-03-15
    在《社会心理学》中提到了两个在现代生活中似乎无可辩驳的事实,一是亲密而持久的婚姻关系是幸福生活的标志;二是亲密而持久的婚姻关系正在减少。由此,人们必须付出努力才能防止爱情的衰退,这就像哈维说的:“‘用心照顾’我们的亲密关系能够使我们获得更长久的满足”,那么怎样才算是对亲密关系的“用心照顾”,也就是说我们应该如何维持夫妻关系,对此,同样在《社会心理学》中给出了一些建议:这些建议虽然有效,但又太过笼统
  • “微笑型抑郁症”患者突然自杀,亲朋好友无比震惊!这类悲剧其实可以预防
    2024-03-15
    我们写过不少关于“微笑型抑郁症”的文章。比如去年7月,一代天后李玟自杀身亡,几乎震惊了所有人!在大众心目中,她一直阳光、热情、爱笑,网友完全没想到她会自杀。她的离世,令不少人开始了解“微笑型抑郁症”。
  • 吃“裸碳水”升糖快,不妨给它加层衣服
    2024-03-15
    你是否听说过“裸碳水”?它是由简单碳水化合物组成的食物,不含脂肪、蛋白或纤维,比如加工食品、糖果、白米饭及含糖汽水等。与全谷物豆类等复合碳水相比,它极易消化并导致血糖飙升,易导致肥胖、二型糖尿病或心脏病。Verywell网站发文称,目前有很多减肥策略要求低碳水,这会走入另一个极端。无论是裸碳水或是复合碳水,都会在体内转化成葡萄糖,这是大脑最青睐的热量来源,对大脑活动以及人体功能非常重要。来源 / unsplash不
  • 天津男篮主场胜四川 李荣培高难度跳投
    2024-03-15
    3月10日,天津先行者队球员李荣培(中)在比赛中投篮。新华社记者 赵子硕 摄当日,在2023-2024赛季中国男子篮球职业联赛(CBA)常规赛第41轮比赛中,天津先行者队主场113比93战胜四川金强队。3月10日,天津先行者队
  • 新疆男篮主场击败北控 阿不都沙拉木突破
    2024-03-15
    3月10日,新疆伊力特队球员阿不都沙拉木(中)在北京控股队球员刘晓宇(右)、陈国豪的夹击防守下突破上篮。新华社记者 胡虎虎 摄当日,在2023-2024赛季中国男子篮球职业联赛(CBA)常规赛第41轮比赛中,新疆伊力特
  • 辽宁本钢胜深圳马可波罗 韩德君篮下强吃
    2024-03-15
    3月12日,辽宁本钢队球员韩德君(左二)在比赛中上篮。新华社记者 潘昱龙 摄当日,在2023-2024赛季中国男子篮球职业联赛(CBA)常规赛第42轮比赛中,辽宁本钢队主场109比98战胜深圳马可波罗队。3月12日,深圳马可波罗队球员萨林杰(左)在比赛中拼抢篮板球。新华社记者 潘昱龙 摄3月12日,辽宁本钢队球员张镇麟(中)在比赛中上篮。新华社记者 潘昱龙 摄3月12日,辽宁本钢队球员张镇麟(左上)在比赛中投篮。新华社记者 潘昱龙 摄3
  • 《谢谢你温暖我》央八首播,流水账记事,故事性差,李兰迪演技好
    2024-03-15
    3月9日,电视剧《谢谢你温暖我》在央八单集首播,在腾讯视频5集更新。基于目前已经上线的剧情内容来讲,这部电视剧在叙事上,过分流水账了,显然不足以用故事性吸引观众。在演技方面,李兰迪确实是该剧的加分项。收视率方面,后续来讲,该剧成绩应该不会好。这部电视剧的剧情梗概已经提前把主线故事亮明了,男女主角谈恋爱之后,男主角生病了,女主角不离不弃照顾男主。这当然是一个很有价值的主线,男女朋友之间,夫妻之间,相濡