News
不像 2024 年那样频繁出现在各种技术播客、大会、访谈里,甚至好多次OpenAI新发布也不见他的身影——这位 AI 圈最活跃的“CEO 网红”,仿佛一下子就开启带娃模式、退居幕后了。
不过近日,OpenAI 也确实发布了一份完全由自己人参与的、实打实的研究论文,其中提出了一种用于高效张量映射的统一代数框架 Linear Layouts。这是一种使用二元线性代数而非比特表示(bit ...
今天凌晨1点,OpenAI开始技术直播对ChatGPT进行了重大更新,包括向macOS用户推出ChatGPT会议记录模式,可以转录任何会议、头脑风暴或语音笔记,并快速提取要点然后转化为新的内容。
Reddit首席法务官Ben Lee在发给外媒TechCrunch的一份声明中表示:“我们绝不容忍像Anthropic这样的逐利公司,肆意将Reddit社区的内容用于商业变现,赚取数十亿美元,却不给予用户任何回报,也不尊重用户隐私。” ...
理想中的AGI不需要包含知识——只需要思考、搜索、模拟和解决任何问题的能力。 完美的人工智能是“一个拥有超人推理能力、1万亿个上下文标记并可以使用你能想到的所有工具的微型模型”。 这是奥特曼在最新的访谈中对下一代模型的展望。
一项封尘18年的数学难题,在短短30天内被AlphaEvolve与人类联手三度突破!和差集指数θ从1.173050提升至1.173077,刷新了加法组合学的天花板。这场「人机共舞」不仅震撼数学界,更预示着科学发现的新纪元。
刚刚,AI编程工具Windsurf的联创兼CEO Varun Mohan发文称,Anthropic几乎没有提前通知,就大幅减少了Windsurf对Claude 3.5和3.7 Sonnet模型的服务配额。
近期,普林斯顿大学 AI Lab 推出了 Alita——一个秉持「极简即是极致复杂」哲学的通用智能体,通过「最小化预定义」与「最大化自我进化」的设计范式,让智能体可以自主思考、搜索和创造其所需要的 MCP 工具。
尽管 Go 团队明确表示不会再推进错误处理的语法层改动,但这并不意味着错误处理的优化空间已经封闭。通过标准库的增强、工具链的改进以及更注重错误处理的上下文信息,开发者仍然可以在保持语言一致性的前提下,提升代码的可读性和开发效率。这一决定不仅体现了 Go 语言对显式性和简单性的坚持,也为未来的工具生态和开发体验优化留下了更多可能性。
就在今天凌晨,OpenAI 官方开发者账号 @OpenAIDevs 在 X 平台上,一口气连续发布了 4 项关键更新,直接把 AI 代理(Agent)开发体验提升到新维度,围绕 Agent ...
过去的研究多数持悲观态度:认为 RL 带来的收益非常有限,有时甚至会让模型「同质化」加重,失去多样性。然而,来自英伟达的这项研究指出,造成这一现象的根本原因在于:数学、编程等任务在 base model 的训练数据中被过度呈现,以及 RL ...
4、对比分析详尽:对OpenAI-o3、GPT-4o、Claude-3.7、Gemini2.5-Pro等模型进行系统评估;人类解题成功率高达93.3%,最强模型OpenAI-o3仅为40.0%;并从策略偏差、视觉错误、执行失败等维度剖析失败原因。
Some results have been hidden because they may be inaccessible to you
Show inaccessible results