site:www.51cto.com - Search News

为此，Scale AI和CAIS推出了名为「人类最后的考试」（Humanity's Last Exam）的多模态基准测试，旨在成为这类封闭式学术基准测试的最终版本，覆盖广泛的学科领域。

这个数据中心在上个月已经官宣，预计整个建设工程会持续到2030年，当时美国一家能源公司还提议，在Meta这个数据中心附近建立一座1.5GW的天然气发电厂。

就说这个本周刚发布的 DeepSeek R1，它没有任何监督训练的纯强化学习路线令人震撼，从去年 12 月 Deepseek-v3 基座发展到如今堪比 OpenAI o1 的思维链能力，似乎是很快达成的事。

最近，ByteDance Research 的视频理解大模型眼镜猴（Tarsier）迎来了巨大更新，发布了第二代模型 Tarsier2 及相关技术报告。研究团队此前发布的 Tarsier-7B/34B ...

他表示，AI系统的本质问题在于它们无法与已有的软件工程实践有效结合，尤其是在复杂性管理和规模控制方面。尽管AI在诸如自动化、医疗、金融等领域取得了显著成就，但其核心问题在于无法确保系统在规模化应用中的可控性与可靠性。

3、独特的公司文化和人才战略： DeepSeek保持着一个完全自下而上的组织结构，为研究人员提供无限的计算资源，优先看创造热情而不是证书。他们的突破性创新来自年轻的本土人才——中国本土的应届毕业生和年轻技术人才，而非海外招聘。

本周三，各路媒体对英伟达 GeForce RTX 5090 的评测宣告解禁。基于最新 Blackwell 架构，新一代旗舰显卡无疑将成为未来几年你能买到的最好的显卡。众所周知，英伟达的 RTX 4090 是一款性能强劲的显卡，为真正需要 4K ...

今天的一条知乎热搜让人惊了：国内某双非名校计算机学院24届本科生就业率，还不足50%？一届学生里大半人毕业就失业，CS就业竟遭遇寒冬。而业内人士表示，高校的疯狂扩招和大模型的火爆，早就让CS普本就业进入地狱模式了。

Meta员工在TeamBlind爆料，点燃了一把火。自诩开源先锋的Meta，直接被DeepSeek这家中国公司整得无地自容。不仅工程师争分夺秒复现模型，年薪超过DeepSeek训练成本的高管们，心底也有点虚。

题目来自500多家机构的1000多名学者，最终入围的题目有3000多道，全部都是研究生及以上难度。史上最难的大模型测试集来了！包括o1在内，没有任何一个模型得分超过10%。

CUA能够如此之强，是因为建立在OpenAI多年关键研究——多模态、推理和安全性领域基础之上。通过融合GPT-4o的视觉能力、深度推理技术和创新的强化学习方法，研发团队攻克了AI操作计算机的诸多技术难关。

去年10月，Anthropic联合创始人Daniela Amodei在接受采访时表示，虽然当前AI编程还不能完全取代工程师，仍需人为给予一定引导，但Claude 3.5 Sonnet显著提升了开发者的工作效率，Anthropic甚至会据此调整招聘计划 ...

Some results have been hidden because they may be inaccessible to you