DeepSeek把本人误认成了ChatGPT?剖析人士:或用了
发布时间:2025-01-05 08:33
DeepSeek新宣布的AI模子会“报错家门”?日前,有网友发明,在向DeepSeek-V3模子发问“你是谁”时,DeepSeek-V3仿佛将本人辨认为ChatGPT。有网友在向DeepSeek-V3模子发问“你是谁”时,DeepSeek-V3将本人辨认为ChatGPT 起源:交际媒体截图在进一步发问DeepSeek API的成绩,它答复也是怎样应用OpenAI API的阐明,乃至讲了一些与GPT-4截然不同的笑话。有网友收回疑难,“DeepSeek能否在ChatGPT天生的文本长进行了练习?”DeepSeek-V3是由海内著名量化资管巨子幻方量化创建的杭州深度求索人工智能基本技巧研讨无限公司(以下简称“深度求索”)最新宣布的全新系列模子,因为这款模子总练习本钱低,性价比高,宣布后不少网友称其为“国产之光”,且有“AI界的拼多多”之称。但在宣布后的一天,便呈现了上述疑似“翻车”景象。停止发稿前,深度求索公司尚未对此停止回应。但现在再次向DeepSeek-V3模子发问“你是谁”时,模子问答已规复畸形。DeepSeek-V3并不是第一个混杂本人的模子。科技媒体TechCrunch报道,此前谷歌的AI模子Gemini在被应用中文发问你是谁时,也答复本人是百度的文心一言。海内一家智能科技公司的技巧担任人向磅礴科技记者剖析时以为,DeepSeek-V3有可能直接将在ChatGPT天生的文本上作为练习基本,在练习进程中,该模子可能曾经记着了一些GPT-4的输出,并正在逐字复述这些内容。尚有业内子士指出,现在互联网年夜模子优质数据练习集无限,练习进程中弗成能不重合,然而否形成剽窃也很难界说。即使“站在了ChatGPT伟人肩膀上,但本钱降上去是真的”。不外,直接在ChatGPT天生的文本上练习DeepSeek-V3也并不奇异,前述智能科技公司技巧担任人指出,拿GPT的答复作为数据集练习自有模子在海内很罕见,“这种不必抓取数据,而且可能额定做数据处置,能节俭时光、人力跟练习本钱。”练习一个年夜模子须要吞噬海量数据,耗尽了天下上全部轻易获取的数据。TechCrunch在报道平分析以为,形成这类景象的起因在于,现在互联网(AI公司获取大批练习数据的处所)正充满着AI渣滓。天生式人工智能年夜模子在互联网数据长进行练习,而这些数据固然信息丰盛,但也充满着禁绝确的内容,此中不乏“胡说八道”。ChatGPT、Copilot跟Gemini等AI东西都市为用户供给看似实在但倒是假造的数据。另据欧洲同盟法律机构的一份讲演指出,到2026年,收集内容中可能有90%是由人工分解天生的。讲演猜测,这种数据“传染”,使得从练习数据中彻底过滤AI天生内容变得十分艰苦。   申明:新浪网独家稿件,未经受权制止转载。 -->