扫一扫 扫一扫
被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线

被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线

2025-07-11 18:21

大约 1 个月前,马斯克所创办的 xAI 团队宣布开源 Grok-1——一个参数量为 3140 亿的 MoE 大模型。从参数量来看,Grok-1 超越了 70B 的 LLaMA 2,是当前开源模型中最

被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线

被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线

2025-07-11 18:14

大约 1 个月前,马斯克所创办的 xAI 团队宣布开源 Grok-1——一个参数量为 3140 亿的 MoE 大模型。从参数量来看,Grok-1 超越了 70B 的 LLaMA 2,是当前开源模型中最

大模型时代的三道鸿沟:数据、成本与想象力

大模型时代的三道鸿沟:数据、成本与想象力

2025-07-11 18:08

跨入2023年,大模型兴起、诸多公司「跑步进场」的头几个月,大模型一边倒向 C 端类 ChatGPT 的研发,对成本、效率更敏感的企业客户似乎不在关注焦点。然而近两个月,情况发生了变化。基于医疗、金融

大模型时代的三道鸿沟:数据、成本与想象力

大模型时代的三道鸿沟:数据、成本与想象力

2025-07-11 18:06

跨入2023年,大模型兴起、诸多公司「跑步进场」的头几个月,大模型一边倒向 C 端类 ChatGPT 的研发,对成本、效率更敏感的企业客户似乎不在关注焦点。然而近两个月,情况发生了变化。基于医疗、金融

60岁大叔扮女装与千余人发生亲密行为?警方通报

60岁大叔扮女装与千余人发生亲密行为?警方通报

2025-07-11 17:43

南京警方7月8日发布警情通报:近日,江宁警方接到群众报警称其隐私视频被他人传播至互联网。江宁警方立即开展调查并于7月5日将犯罪嫌疑人焦某某抓获归案。经查,焦某某男,38岁,外省来宁人员)假扮女性,相约

AI Infra 往事之异构计算篇:吴韧与他的学生们

AI Infra 往事之异构计算篇:吴韧与他的学生们

2025-07-11 17:23

2013年9月底,吴韧受百度邀请,以杰出科学家的身份加入百度深度学习研究院IDL),此时正值他五十知天命的年纪。吴韧在人工智能领域耕耘多年,当时已是一名顶尖的AI计算科学家。2012年深度学习崛起前后

AI Infra 往事之异构计算篇:吴韧与他的学生们

AI Infra 往事之异构计算篇:吴韧与他的学生们

2025-07-11 16:19

2013年9月底,吴韧受百度邀请,以杰出科学家的身份加入百度深度学习研究院IDL),此时正值他五十知天命的年纪。吴韧在人工智能领域耕耘多年,当时已是一名顶尖的AI计算科学家。2012年深度学习崛起前后

哀悼 !中国计算机视觉领军者、商汤创始人汤晓鸥去世

哀悼 !中国计算机视觉领军者、商汤创始人汤晓鸥去世

2025-07-11 16:04

12 月 16 日中午雷峰网获悉:上海人工智能实验室主任、商汤科技创始人、香港中文大学信息工程学系教授汤晓鸥去世。经多位独立信源确认,此消息属实,目前等待官方发布讣告。20世纪60年代末,汤晓鸥出生于

警惕!“美企竟这样绕过禁令,偷拿中国关键矿物”

警惕!“美企竟这样绕过禁令,偷拿中国关键矿物”

2025-07-11 16:04

【文/观察者网 柳白】面对中国依国际惯例执行的关键矿物管制,一些美西方买家叫苦不迭,甚至动起歪脑筋。路透社7月9日报道披露,为绕过中方管制,有美国买家通过第三国转运拿到了矿物。比如根据海关和航运记录,

价格战之后,智谱来到商业化的下一站

价格战之后,智谱来到商业化的下一站

2025-07-11 16:04

「雷峰网(公众号:雷峰网)消息」刚刚过去的 5 月里,中国 AI 大模型领域掀起一场价格战,激起行业热议。这次价格战的两股势力分别是互联网大厂和大模型创业公司,以字节、阿里云、腾讯和智谱为主要参战代表

大模型生产力的头场变革,从英特尔商用 AI PC 说起

大模型生产力的头场变革,从英特尔商用 AI PC 说起

2025-07-11 15:56

作者丨郭思编辑丨陈彩娴「水利万物而不争。」这是英特尔公司高级副总裁、英特尔中国区董事长王锐女士常说的一句话,看似没有压迫性,却切实点出了英特尔作为 AI PC 概念提出者,这场大语言模型技术革命中的思

大模型助力企业数据驱动,火山引擎数智平台发布 AI 助手

大模型助力企业数据驱动,火山引擎数智平台发布 AI 助手

2025-07-11 15:48

9月19日,火山引擎在其举办的“V-Tech数据驱动科技峰会”上宣布,火山引擎数智平台VeDI推出“AI助手”,通过接入人工智能大模型,帮助企业提升数据处理和查询分析的效率。即使是不会写代码的运营人员

大图推荐

TikTok正开发仅面向美国用户的独立应用?TikTok回应

TikTok正开发仅面向美国用户的独立应用?TikTok回应

独家|前百度搜索老将赵世奇从华为离职,回归百度

独家|前百度搜索老将赵世奇从华为离职,回归百度

马斯克的Space X卫星被破解,25美元的工具就能入侵终端,篡改运行任意代码,攻击手法已公开

马斯克的Space X卫星被破解,25美元的工具就能入侵终端,篡改运行任意代码,攻击手法已公开

2023 IDEA大会开幕 共探AI新篇章下的技术创新与创业

2023 IDEA大会开幕 共探AI新篇章下的技术创新与创业

商务部回应美商务部长称可能于8月初与中方谈判代表会面

商务部回应美商务部长称可能于8月初与中方谈判代表会面

对话加拿大工程院于非院士:寻找 AI 领域的「香农定理」

对话加拿大工程院于非院士:寻找 AI 领域的「香农定理」

百川智能首款 AI 应用主打懂搜索,但王小川不做搜索 2.0

百川智能首款 AI 应用主打懂搜索,但王小川不做搜索 2.0

若愚科技:基于多模态大模型的机器人“大脑”领导者

若愚科技:基于多模态大模型的机器人“大脑”领导者

AIGC:我不是元宇宙的附庸品

AIGC:我不是元宇宙的附庸品

Pieter Abbeel 新工作“大世界模型”:轻松玩转1小时长视频,一对一QA视频内容细节

Pieter Abbeel 新工作“大世界模型”:轻松玩转1小时长视频,一对一QA视频内容细节

浪潮信息彭震:AI+是目标也是机会,要推动AI成为百行千业的生产力

浪潮信息彭震:AI+是目标也是机会,要推动AI成为百行千业的生产力

对话中科深智成维忠:数字人的关键是交互,交互的关键是大模型

对话中科深智成维忠:数字人的关键是交互,交互的关键是大模型

马斯克的Space X卫星被破解,25美元的工具就能入侵终端,篡改运行任意代码,攻击手法已公开

马斯克的Space X卫星被破解,25美元的工具就能入侵终端,篡改运行任意代码,攻击手法已公开

百川智能发布Baichuan2—Turbo系列API,开启企业定制化新生态

百川智能发布Baichuan2—Turbo系列API,开启企业定制化新生态

用扩散模型生成神经网络?NUS 尤洋团队:这不是开玩笑

用扩散模型生成神经网络?NUS 尤洋团队:这不是开玩笑

百川智能发布Baichuan2—Turbo系列API,开启企业定制化新生态

百川智能发布Baichuan2—Turbo系列API,开启企业定制化新生态

通义千问登顶Hugging Face榜首,国产开源大模型赶超Llama2

通义千问登顶Hugging Face榜首,国产开源大模型赶超Llama2

阿里云 all in AI 的决心

阿里云 all in AI 的决心

马斯克的Space X卫星被破解,25美元的工具就能入侵终端,篡改运行任意代码,攻击手法已公开

马斯克的Space X卫星被破解,25美元的工具就能入侵终端,篡改运行任意代码,攻击手法已公开

为每个用户提供专属定制服务,OPPO 安第斯大模型的新卷法

为每个用户提供专属定制服务,OPPO 安第斯大模型的新卷法