埃隆马斯克也认为用于训练AI的真实世界数据所剩无几 未来只能靠合成数据
埃隆马斯克的观点与其他人工智能行业专家的观点基本相同,那就是用于训练人工智能模型的真实世界 (区别于机器生成) 数据已经所剩无几。
本周埃隆马斯克与 STAGWELL 董事长在 X/Twitter 进行直播时埃隆马斯克表示,我们现在基本上已经耗尽人类在人工智能训练方面积累的全部知识,这基本上发生在 2024 年。
有鉴于人类自己产生的数据已经被耗尽,所以埃隆马斯克认为合成数据也就是由人工智能模型本身生成的数据是未来的发展方向,补充的唯一方法就是使用合成数据,有了合成数据后人工智能就会自我评分并经历自我学习的过程。
值得注意的是由于无法获取到最后多的真实世界新数据,包括埃隆马斯克的 xAI、微软、Meta、OpenAI 和 Anthropic 等科技巨头都已经开始使用合成数据训练 AI 模型。
市场调查公司 Gartner 的预计则是在 2024 年用于人工智能和分析项目中的数据可能有高达 60% 都是合成的而非人类产生的真实数据。
微软在最新推出的 Phi-4 系列模型中也同样使用合成数据和真实数据进行训练,谷歌开源的 Gemma 模型同样如此,都是靠合成数据才完成模型的最终训练。
使用合成数据的优点很多,包括获取方式相对来说比较容易、节省成本还可以规避某些版权问题等。但缺点也很明显,某些研究表明合成数据可能会导致模型崩溃,即模型的输出不那么有创意而且会更加偏颇。
如果用于训练的合成数据本身存在偏见和局限性,那么训练出来的人工智能模型也同样会存在这样的缺点或受到影响,最终影响到人工智能模型的质量。
-
域名和网络托管商GoDaddy遭FTC起诉 原因是多次数据泄露和极差的安全性
在美国联邦贸易委员会 (FTC) 日常起诉的公司名单里我们发现了 GoDaddy,没想到这家网络服务托管商和域名注册商也会遭到起诉,所以这还是挺让蓝点网惊讶的。日前 FTC 正式对 GoDaddy 提
-
微软似乎已通过后端服务器禁用UWP版邮件应用 目前无法正常登录账号
如果你还在使用 UWP 版邮件和日历的话,可能已经发现无法正常登录账号,甚至此时打开邮件和日历应用都会弹出切换到新版 Outlook 窗口无法绕过。微软虽然已经提前预告过但似乎到现在才正式在后端服务器
-
ChatGPT推出任务功能可以设置定时动作 到时间后自动向你发送提醒
ChatGPT 提供的功能还在进化中,最新推出的功能是任务 (Tasks),用户可以借助该功能编排任务然后到特定时间后 ChatGPT 就会主动向你发送提醒。目前任务功能还在测试阶段因此仅面向 Cha
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/
随时掌握互联网精彩
- 雷神新款25寸显示器上市:1080P 300Hz屏首发949元
- 校验大师 2.7.5.1632最新版本2022下载地址
- 我的世界启动器 v1.9.10最新版本2022下载地址
- 康福星 v2.0.5最新版本2022下载地址
- 模拟医院:我是院长iOS v1.0.7最新版本2022下载地址
- 野兽传奇 1.0最新版本2022下载地址
- 机器人制造有哪些厂家
- 趣骑车app v1.3.1最新版本2022下载地址
- EVO汽车杂志 V4.4最新版本2022下载地址
- 火靶 v1.2.3最新版本2022下载地址
- Joboshare AVI MPEG Converter 3.3.2.1022最新版本2022下载地址
- 兼职侠app v1.0最新版本2022下载地址