马斯克:事实世界顶用于练习 AI 模子的数据曾经
发布时间:2025-01-11 08:33
IT之家 1 月 9 日新闻,据 TechCrunch 报道,马斯克与其余人工智能专家分歧以为,事实天下顶用于练习 AI 模子的数据多少乎曾经耗尽。在周三晚间与 Stagwell 董事会主席马克・佩恩的直播对话中,马斯克表现:“咱们当初基础上曾经耗费失落了全部人类常识的积聚…… 用于人工智能练习的数据。这个景象基础上是客岁产生的。”马斯克此番舆论与前 OpenAI 首席迷信家伊利亚・苏茨克弗(Ilya Sutskever)在客岁 12 月的 NeurIPS 集会上的观念类似。苏茨克弗曾指出,AI 行业曾经到达了所谓的“数据峰值”,并猜测将来缺少充足的练习数据,将迫使 AI 模子的开辟方法产生转变。马斯克以为,分解数据(IT之家注:即人工智能模子自我天生的数据)是将来的处理计划。“弥补事实天下数据的独一道路是经由过程分解数据,也就是让 AI 本人天生练习数据。AI 会停止自我评价,并经由过程这一自我进修的进程一直优化本人。”现在,很多科技公司,包含微软、Meta、OpenAI 跟 Anthropic 等,曾经开端应用分解数据来练习他们的主力 AI 模子。据 Gartner 估量,到 2024 年,用于人工智能跟数据剖析名目的 60% 数据将是经由过程分解方法天生的。应用分解数据的一个明显上风是下降本钱。人工智能始创公司 Writer 表现,其 Palmyra X 004 模子多少乎完整依附分解数据停止开辟,开辟本钱仅为 70 万美元,而一个范围类似的 OpenAI 模子的开辟本钱大概为 460 万美元。但是,分解数据也存在必定的危险。研讨标明,分解数据可能会招致模子机能降落,输出成果不只缺少翻新性,并且可能变得愈加偏颇,终极重大影响其功效性。由于模子是经由过程本人天生分解数据停止练习的,假如这些数据自身带有成见或范围性,那么终极模子的输出也会遭到这些要素的影响。