新闻 /
“字节逾越大模子历练被实习生攻击,涉事者已被解雇”的音讯冲上多个平台热搜。
10月18日,多个微信群流传一则音讯:“某头部大厂的大模子历练被实习生入侵,注入了碎裂代码,导致其历练后果不行靠,可能需要重新历练。据称遭到入侵的代码注入了8000多张卡,带来的赔本可能零散千万好意思元。”
对此,证券时报·e公司记者相关字节逾越方面,为止发稿并未获获得话。但接近字节东谈主士对e公司记者显露,确有实习生碎裂AI模子历练,但赔本金额和处理形状被夸大。
靠近安全管制问题
据界面新闻报谈,从知情东谈主士处获悉,该头部大厂为字节逾越。此事发生在本年6月,缘故是某高校的博士在字节逾越买卖化时候团队实习,因对团队资源分拨不悦,使用攻击代码碎裂团队的模子历练任务。
神话夸耀,该田姓实习生愚弄了HF(huggingface)的裂缝,在公司的分享模子里写入碎裂代码,导致模子的历练效果忽高忽低,无法产生预期的历练效果,而况AML团队无法核查原因。但神话曝出之后,该实习生还在某微信群里辟谣称,我方发完论文后就从字节逾越辞职,这个当口有另一个东谈主钻裂缝改模子代码,把锅扣到我方头上。
据媒体从知情东谈主士处了解到,字节逾越里面也曾探问明确此事为田姓实习生所为。现在,该实习生已被解雇,字节逾越同期把此事同步给行业定约和该实习生场所的学校。但这名实习生被解雇后到处“辟谣”甩锅,称是其他东谈主所为。
另有报谈称,一位时候安全众人向媒体暗意,HF裂缝的产生频繁与单一性相接历练相关,这次事件裸透露字节逾越在时候历练中的安全管制问题。公司既未推论权限阻止,也未作念好共用代码的审计责任。在平素情况下,每次大的代码变动都应进行审计,并纪录操作陈迹,以确保无法单独批改代码。
该时候安全众人指出,现在行业通用的作念法是推论三级阻止导向性部署,每一级仅包含镜像,并在每次操作前进行扫描。调用需循序计算,并必须提供密钥。每一级完成后,才气插控制一级,同期上一级将自动删除,以竣事分级历练。
实质上,e公司记者认知到,大模子在安全性方面的问题已罗致到业内高度善良。本年8月,中国信通院发文称,连年来,以大模子为中枢的东谈主工智能时候连忙发展,成为数字经济增长新动能。可是,行动新质坐褥力的大模子在安全性方面仍存在较多症结,这为其大限制落地应用带来了不笃定性。近期,中国信通院发布的大模子安全基准AI Safety Benchmark的测试收尾夸耀,大模子(尤其是开源大模子)在坏心教导技能下的攻击告捷率均较原始输入有昭彰晋升。因此,对大模子进行安全对都驻扎刻阻难缓。
加码大模子应用
本年以来,行动头部互联网大厂,字节逾越正在加码大模子开发和应用。5月15日,字节逾越豆包大模子在火山引擎原能源大会上发布。火山引擎是字节逾越旗下云行状平台,火山引擎总裁谭待现场先容,豆包大模子正成为国内使用量最大、应用场景最丰富的大模子之一,现在日均处理1200亿Tokens文本,生成3000万张图片。豆包主力模子在企业市集的订价唯有0.0008元/千Tokens,0.8厘就能处理1500多个汉字,比行业低廉99.3%。
而后,各大厂的大模子开启大幅降价,价钱战愈演愈烈。
本年8月,字节逾越火山引擎书记推出对话式AI及时交互治理决策,搭载火山方舟大模子行状平台,通偏激山引擎RTC竣事语音数据的汇注、处理和传输,并深度整合豆包·语音识别模子和豆包·语音合成模子,简化语音到文本和文本到语音的挫折经过,提供智能对话和当然谈话处理才略,匡助应用快速竣事用户和云霄大模子的及时语音通话。
近期,字节逾越还宣告挫折AI视频生成。9月24日,字节逾越旗下火山引擎发布了豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模子,面向企业市集开启邀测。据火山引擎先容,全新考虑的扩散模子历练圭表攻克了多镜头切换的一致性贫窭。据火山引擎败露,为止9月,豆包谈话模子的日均tokens使用量零散1.3万亿,比较5月初度发布时猛增十倍。
10月15日,在2024火山引擎视频云时候大会上,火山引擎庄重发布大模子历练视频预处理决策,该决策八成有用治理视频大模子历练的老本、质料和性能等方面的时候挑战,并已应用于豆包·视频生成模子中。
- 字节AI最新大招:豆包“全家桶”火爆出圈 卷起AI“价钱战”2025-02-28