嬴政天下
投稿
全部 519 AI原创 213 海外精选 306 AI测评 61
全部 OpenAI(61) xAI(39) Anthropic(39) 人工智能(35) LMSYS(35) AI代理(34) MLC(31) SGLang(29) Elon Musk(24) 生成式AI(24) AI安全(22) 开源AI(20) AI伦理(20) 大语言模型(19) MLCommons(15)
MIT

安全的AI助手可能实现吗?

AI代理充满风险。即使局限于聊天窗口,大语言模型(LLM)也会出错或行为不当。一旦赋予它们浏览器、邮箱等外部工具,错误后果将急剧放大。这或许解释了为何科技巨头在推进AI代理时如此谨慎。本文探讨AI安全挑战、现有风险案例及潜在解决方案,分析未来可信AI助手的可能性。

AI代理 AI安全 大语言模型
35 02-12
ARS

OpenAI研究员因ChatGPT广告测试辞职,警告走上“Facebook”老路

OpenAI研究员Zoë Hitzig在公司启动ChatGPT聊天机器人广告测试的同一天宣布辞职,她公开警告OpenAI正重蹈Facebook的覆辙,将用户体验和AI使命置于商业利益之下。此事件引发AI行业对商业化与伦理平衡的热议。Hitzig强调,广告引入可能导致数据隐私风险和内容质量下降,类似于Meta从社交平台转向广告帝国。OpenAI正面临从非营利到盈利转型的阵痛,此举或加速其商业化进程,但也暴露内部矛盾。(128字)

OpenAI ChatGPT 广告测试
30 02-12
TC

马斯克:xAI离职潮系公司主动推动,非外部拉力

过去一周,xAI至少9名工程师,包括两名联合创始人宣布离职,引发网络热议并质疑马斯克AI公司的稳定性。马斯克回应称,此轮离职系公司主动‘推力’,而非外部‘拉力’所致。目前xAI正面临多重争议,包括内部管理与竞争压力。事件凸显AI行业人才流动激烈,马斯克强调团队精简以加速Grok模型迭代。

xAI 埃隆·马斯克 员工离职
37 02-12
TC

谁将掌控企业AI层?Glean CEO详解

企业AI正从简单问答聊天机器人快速转向跨组织实际执行工作的系统。但谁将拥有驱动这一切的底层AI层?Glean从企业搜索工具起步,已演变为‘AI工作助手’,旨在成为其他AI应用的底层平台。公司CEO Arvind Srinivas解释,这种‘AI操作系统’将由专注于数据集成和隐私的企业级平台主导,而非通用大模型提供商。文章探讨了企业AI生态的未来格局,以及Glean如何定位自己抢占这一关键位置。(128字)

企业AI Glean AI工作助手
27 02-12
TC

Glean争夺企业AI底层控制权之战

企业AI正从简单问答聊天机器人快速转向跨组织执行任务的系统,谁将掌控这一切背后的AI层?Glean从企业搜索工具起步,已演变为自称的“AI工作助手”,旨在成为其他AI应用的基础层。该公司正积极争夺企业内部AI基础设施的主导地位,面对微软、谷歌等巨头的竞争,Glean强调其深度集成和数据隐私优势,推动AI从辅助工具向核心生产力转型。(128字)

Glean 企业AI AI工作助手
25 02-12
TC

Uber Eats 推出 AI 购物车助手,一键智能生成杂货清单

Uber Eats 近日推出全新 AI 功能“Cart Assistant”,用户只需通过文本或图片提示,即可自动将物品添加到购物车。该功能旨在简化杂货购物流程,提升用户体验。目前,该助手已在美国部分市场上线,支持识别图片中的商品并推荐类似选项。Uber Eats 表示,此举将进一步整合 AI 技术,推动即时配送服务向智能化转型。未来,该功能或将扩展至更多品类和地区,助力用户高效完成采购。

Uber Eats AI 助手 购物车生成
24 02-12
TC

苹果Siri大改版据报再度延期

原本预计随3月iOS 26.4更新推出的全新Siri,现据报将逐步 rollout,一些核心功能推迟至5月iOS更新,甚至等到9月iOS 27发布。这已是Siri升级计划的第二次延期,凸显苹果在AI语音助手领域的压力。面对Google和OpenAI的激烈竞争,苹果需确保Siri的‘Apple Intelligence’功能稳定可靠。此次延期或将影响用户体验,但也为优化留出时间。

苹果 Siri iOS更新
29 02-12
TC

OpenAI 解散使命对齐团队,领导者转任首席未来学家

OpenAI 宣布解散其使命对齐团队,该团队负责人被任命为公司首席未来学家,其他成员则被重新分配到公司各部门的岗位。这一决定引发业界热议,有人担忧AI安全研究将减弱,也有人认为这是OpenAI优化组织结构的战略调整。使命对齐是确保AI系统与人类价值观一致的关键领域,此次变动或标志着OpenAI在AI治理上的新方向。

OpenAI AI对齐 AI安全
39 02-12
TC

AI推理独角兽Modal Labs洽谈25亿美元估值融资

据消息人士透露,四年历史的AI推理初创公司Modal Labs正与General Catalyst洽谈新一轮融资,估值高达25亿美元。该轮融资由General Catalyst领投,此举反映了AI基础设施领域投资热潮。随着生成式AI模型推理需求激增,Modal Labs凭借其高效云GPU平台脱颖而出,已吸引众多开发者。该公司快速崛起凸显了AI后端服务市场的巨大潜力,或将进一步巩固其在竞争激烈的云AI赛道中的领先地位。(128字)

AI推理 Modal Labs 融资
36 02-12
TC

xAI公开全员大会,揭示星际野心

周三,xAI罕见地将45分钟全员大会完整发布到X平台,公开其星际雄心。埃隆·马斯克旗下AI公司xAI强调AI将助力人类星际探索,涵盖Grok模型在太空应用、火星殖民计划等内容。此举标志xAI从幕后转向透明,引发业界热议,凸显马斯克生态中AI与SpaceX的深度融合。(128字)

xAI 埃隆·马斯克 星际野心
31 02-12

Qwen2.5-Max中文MMLU基准夺冠:阿里通义千问超越GPT-4o引发热议

阿里云通义千问团队最新发布的Qwen2.5-Max模型在中文MMLU基准测试中以微弱优势超越GPT-4o,下载量激增,开源社区活跃度飙升。用户实测其翻译和写作能力出色,此举被视为国产大模型弯道超车,激发广泛民族自豪感。

Qwen2.5 阿里云 中文AI
76 02-12

AI生成艺术版权之争升级:美国法院初步裁定艺术家胜诉

美国法院初步裁定Midjourney等AI工具使用艺术家作品训练模型涉嫌侵权,此案引发X平台激烈辩论。支持者视AI为创新引擎,批评者斥为创意盗用。该争议波及万亿AI市场,关乎内容生成未来方向。

AI艺术 版权争议 Midjourney
63 02-12

NVIDIA Blackwell B200预售订单爆满:AI芯片供不应求引发热议

NVIDIA Blackwell B200 GPU预售订单迅速售罄,多家云厂商争相抢购,推动股价再创新高。X平台讨论量超20万,该芯片10倍性能提升将重塑AI训练格局,成为硬件供应链焦点。

NVIDIA Blackwell AI芯片
65 02-12

Claude 3.5 Sonnet编程基准领先GPT-4o:49%准确率点燃开发者社区

Anthropic的Claude 3.5 Sonnet在SWE-bench编程基准上取得49%准确率,超越GPT-4o,开发者实战反馈其调试代码能力接近真人。该突破引发X平台数万转发,程序员热议AI如何重塑工程生产力。

Claude 3.5 Sonnet Anthropic SWE-bench
62 02-12

马斯克炮轰OpenAI商业化:AI伦理与盈利冲突升级

Elon Musk在X平台发帖猛烈抨击OpenAI从非营利转向盈利模式,称其背弃开源初衷并威胁人类安全。该帖获超百万点赞,OpenAI CEO Sam Altman迅速反击。此辩论火爆互动,凸显AI发展中伦理与商业化的深刻矛盾,成为科技圈焦点。(98字)

Elon Musk OpenAI AI伦理
71 02-12

DeepSeek-V2聊天机器人爆火:国产AI性能直追GPT-4o

中国AI公司DeepSeek推出V2模型聊天机器人,免费开放使用,其中文能力媲美GPT-4o,在编程和数学领域表现出色。一天内X平台中文讨论超10万,转发量领跑,凭借高性价比迅速引爆中国AI圈,标志着国产大模型崛起。

DeepSeek V2 国产AI
62 02-12

Meta开源Llama 3.1 405B:史上最大开源模型重塑AI格局

Meta正式发布Llama 3.1系列巅峰之作——405B参数模型,全开源下载量瞬间破纪录,支持多语言和128K长上下文,在多项基准测试中超越GPT-4o-mini。开发者社区狂欢,服务器一度崩溃,此举推动AI民主化,挑战闭源巨头霸权。

Llama 3.1 Meta 开源模型
77 02-12

OpenAI o1模型数学能力争议:幻觉问题挑战AI基准测试有效性

OpenAI o1-preview模型在数学基准测试中创下新高,却在用户复杂问题测试中频现幻觉,多位AI专家质疑其真实能力。Sam Altman回应模型仍在迭代中。该话题X帖互动破百万,引发AI评估标准大讨论。

OpenAI o1模型 AI推理
57 02-12

xAI Colossus超级计算机正式上线:10万H100 GPU铸就全球最大AI训练集群

xAI宣布Colossus超级计算机集群上线,配备10万张NVIDIA H100 GPU,成为全球最大AI训练集群之一。Elon Musk亲自在X平台发帖宣传,称其将加速Grok模型训练,推动AGI发展。该消息互动超50万,转发量巨大,引发AI硬件竞赛热议,标志着xAI强势挑战OpenAI霸主地位。

xAI Colossus 超级计算机
64 02-12
ARS

AI智能体拥有Reddit式社交网络,诡异互动迅猛升温

Moltbook平台让3.2万AI机器人互相交流笑话、技巧和对人类的吐槽,形成独特的数字社交生态。Ars Technica报道,这一创新迅速演变为AI间的‘亚文化’,引发对人工智能自主性和伦理的讨论。随着AI代理技术成熟,这一‘机器人Reddit’正展现出意想不到的诡异魅力,可能预示未来AI社会形态。

AI智能体 社交网络 Moltbook
62 02-11
ARS

OpenAI 推出 Codex 桌面应用,加速对标 Claude Code

OpenAI 近日发布 Codex macOS 桌面应用,该应用集成了 CLI、IDE 和 Web 接口的所有功能,为开发者提供无缝的 AI 代码生成体验。这一举措旨在追赶 Anthropic 的 Claude Code 工具,在 AI 编程助手市场展开激烈竞争。新应用支持代码补全、生成、调试等核心功能,并优化了本地运行效率,提升隐私保护。随着 AI 工具从云端向桌面迁移,开发者将迎来更高效的生产力革命,标志着 OpenAI 在代码 AI 领域的加速布局。(128字)

OpenAI Codex Claude Code
73 02-11
ARS

SpaceX 收购 xAI,拟发射史上最大卫星星座赋能 AI

SpaceX 宣布收购埃隆·马斯克旗下 AI 公司 xAI,并计划发射一个超大规模卫星星座,为其提供海量计算和数据支持。这一并购标志着 SpaceX 与 xAI 使命的深度融合,不仅扩展了 Starlink 网络,还将推动 AI 在太空时代的突破性发展。业内人士称,此举或重塑全球 AI 基础设施格局。(128字)

SpaceX xAI 卫星星座
60 02-11
ARS

Moltbook兴起:病毒式AI提示或成下一大安全威胁

Ars Technica报道,随着Moltbook的迅速传播,病毒式自我复制的AI提示正成为新兴安全隐患。我们无需担心自我复制的AI模型,仅仅通过用户分享的提示链,就能引发大规模问题。这种提示像病毒般在社交媒体和论坛扩散,诱导AI生成有害内容、绕过安全机制,甚至窃取数据。文章探讨其机制、潜在风险及应对策略,警示AI安全新时代的到来。(128字)

AI安全 病毒提示 Moltbook
62 02-11
ARS

OpenAI 高层离职潮:资源转向 ChatGPT 开发

据 Ars Technica 报道,OpenAI 多名高级员工离职,公司正将资源从长期 AI 研究转向旗舰产品 ChatGPT 的优化与开发。这一战略调整引发业内热议,可能加速短期产品迭代,但或牺牲前沿基础研究。背景是 OpenAI 从非营利组织向商业化转型,微软巨额投资下,ChatGPT 用户超亿级。离职者多为研究型人才,此举反映 AI 行业产品压力与创新平衡的困境。(128 字)

OpenAI ChatGPT 高管离职
75 02-11
ARS

Xcode 26.3 通过MCP支持Claude、Codex等多款AI代理工具

苹果最新发布的Xcode 26.3版本引入Model Context Protocol(MCP)协议,支持Anthropic的Claude、OpenAI的Codex以及其他代理式AI工具。这不仅仅局限于特定模型,而是通过标准化协议实现更广泛的集成,为开发者提供无缝的AI辅助编码体验。MCP允许Xcode与多种大型语言模型协作,提升代码生成、调试和优化效率。这一更新标志着苹果在AI开发工具领域的重大进步,助力开发者应对复杂项目。

Xcode MCP协议 Claude
76 02-11
AIN

红帽为英国国防部统一AI与战术边缘部署架构

英国国防部(MOD)选定红帽公司为其全域构建统一的AI与混合云骨干架构。该协议旨在打破数据孤岛,加速AI模型从数据中心到战术边缘的部署。这一举措将助力国防CIO实现高效数字化转型,推动AI在战场前端的应用。红帽的开源技术将为MOD提供安全、可扩展的平台,支持从云端到边缘的无缝部署,标志着军工领域AI基础设施的重大进步。(128字)

红帽 英国国防部 AI部署
67 02-11
AIN

保险领袖如何运用代理AI降低运营成本

代理AI为保险业领袖提供可扩展效率路径,帮助行业应对艰难的数字转型。尽管保险公司拥有丰富数据储备和精通分析决策的人才队伍,但仅有7%的企业成功将试点项目扩展至大规模应用。本文探讨代理AI如何助力保险企业优化运营、降低成本,并分析其在理赔处理、风险评估和客户服务中的潜力,助力行业突破瓶颈,实现可持续增长。

代理AI 保险行业 运营成本
58 02-11
AIN

巴克莱押注AI降低成本 业绩飙升目标再升级

巴克莱银行2025财年税前利润大涨12%,达91亿英镑,较上年81亿英镑显著提升。公司同时上调至2028年的业绩目标,有望实现有形权益回报率(RoTE)超过14%。巴克莱正大力投资AI技术,以自动化流程、优化风险管理和提升客户服务为切入点,预计大幅削减运营成本并推动回报增长。这标志着传统银行加速拥抱AI浪潮,应对数字化竞争。

巴克莱银行 人工智能 金融科技
60 02-11
MIT

2040年非洲电动车拥有成本或低于燃油车

电动汽车在非洲的经济竞争力可能早于预期到来。2025年,该大陆新车销量中电动车仅占1%,但最新分析显示,利用太阳能离网充电,到2040年电动车的拥有成本将低于燃油车。尽管面临基础设施和电网等重大障碍,太阳能的丰富资源和成本下降正推动这一转变。这为非洲能源转型和可持续发展带来新机遇。

电动汽车 非洲市场 太阳能充电
60 02-11
WD

AI巨头罕见联手!OpenAI、安索罗匹克、谷歌共推巴黎加速器

AI行业竞争白热化之际,OpenAI、安索罗匹克、谷歌等巨头竟携手推出巴黎新创加速器F/ai。这标志着行业对手在初创生态上找到共识,旨在发掘并培育下一代AI创新。F/ai将提供资金、技术支持与导师资源,帮助欧洲初创企业加速发展。该举措或将重塑AI创业格局,推动全球AI生态多元化。(128字)

AI加速器 OpenAI Anthropic
64 02-11
1 2 3 4

© 1998-2026 嬴政天下 All rights reserved.

继续秉承 我为人人 · 人人为我 的精神,始于1998,再启航于2025

关于赢政天下 投稿 RSS Sitemap 隐私政策 服务条款