八重神子焯出水MiniMax开八重神子焯出水年甩出一张王炸_ZAKER新闻
MiniMax开八重神子焯出水年甩出一张王炸_ZAKER新闻
8月15日,国家卫生健康委就全国医药领域腐败问题集中整治工作发布有关问答时表示,医药领域腐败问题依然存在,特别是近年来查处的一些“关键少数”、关键岗位人员,利用权力寻租、大肆收受回扣、行贿受贿等案件,严重稀释了医药事业改革发展红利,蚕食了人民群众权益,既掣肘医疗、医保、医药事业改革发展,又影响了行业形象,也危害了医药卫生领域绝大多数人的利益。
出品 | 虎嗅科技组作者 | 王欣编辑 | 苗正卿头图 | 电影《赌神》MiniMax 有点 " 变味儿 " 了?此前,凭借海螺 AI 等 C 端产品在海外爆火的大模型厂商 MiniMax,近期打出了一张 " 技术牌 "。1 月 15 日,他们发布并开源新一代 01 系列模型(基础语言大模型 MiniMax-Text-01 和视觉多模态大模型 MiniMax-VL-01)。值得注意的是,得益于创新性地大规模引入线性注意力机制,01 系列模型支持最多 400 万个 token 的上下文输入。这是 MiniMax 在基于 MoE 架构的 abab 系列文本模型上的再度创新。亮出底牌,似乎也回应了当下对大模型公司们的 " 灵魂拷问 " ——究竟做不做预训练?还追不追求 AGI?" 这个模型的结构是独特、创新的,只能是靠自己预训练来的。"MiniMax 这样对虎嗅表示。换言之,MiniMax 目前依然坚持预训练的投入。MiniMax 向虎嗅透露,未来他们的技术迭代方向为:" 短期来看,把复杂 coding 的基础能力逐渐完善;长期来说,我们把包含多模态的 agent 能力做好。"而回到 MiniMax 出发的原点,在 2021 年 9 月 MiniMax 成立前的白板前,创始人闫俊杰就清晰地列下了未来的愿景:下一代 AI、接近图灵测试的智能体、智能创造极致体验。为了让员工有更具像化的感受,他还在当场与《底特律 · 变人》、" 贾维斯 " 等经典 IP 作为对比。即便三年后,Scaling Law 撞墙、AGI 信仰面临重构,但闫俊杰坚信 MiniMax 会一直在浪潮中,并把技术迭代作为最重要的目标。。鲜明的技术派实际上,虽然最初凭借 Glow、星野等 C 端产品出圈,但 MiniMax 团队素来认为自己的的技术底色浓重。此前虎嗅与 MiniMax 交流时,对方就强调 " 对我们公司来讲,我们肯定是先做技术上的东西。技术模型能够提供什么样的能力,我们再看自己的产品可不可以调整。如果实在调整不了,那有可能会有新的 APP 出来。"而更重要的是,他们认为 " 通用基础大模型才是这一波大模型浪潮的王道。"因此不难理解,在其他友商选择追求现实主义路线、转投新赛道时,MiniMax 却选择继续重投基础模型架构的创新。曾经,AI 学术界不断迭代升级的技术路线就像接力赛,每隔一年或半年总会有更好的模型涌现。1998 年,杨立昆提出了多层 CNN 卷积神经网络;2016 年,最流行的是 RNN 循环神经网络的变种—— LSTM;半年后,与其对标的 Transformer 横空出世。然而,人们预想的能够颠覆 Transformer 架构的新模型并没有出现。而 Transformer 架构的局限性也满足不了一些应用场景的要求——例如,在生成长文本时,传统 Transformer 架构可能会丧失上下文的连贯性,尤其是当输入文本较长且模型只关注局部上下文时。生成的文本可能缺乏一致性,或者前后内容有明显的脱节,无法满足一些对文本连贯性要求较高的应用场景,比如对长上下文能力与多模态处理能力要求较高的 Agent 场景。因此,MiniMax 引入了线性注意力机制,这有利于解决传统 Transformer 架构下长文本计算复杂度高、上下文理解受限、内存消耗大的问题。通过这一架构创新,他们实现了 400 万 token 的上下文处理能力。作为对比,此前 GPT-4o、Claude-3.5-Sonnet 的相关能力大约在 100k 水平左右。受益于 Linear Attention 层面的架构创新、算力层面的优化,以及集群上的训推一体的设计,使得 01 系列模型定价也被团队视为竞争力之一——标准定价是输入 token 1 元 / 百万 token,输出 token 8 元 / 百万 token。这里我们可以以 Deepseek v3 的定价对比,Deepseek v3 API 服务定价为,输入 2 元 / 百万 token,输出 8 元 / 百万 token。相对而言,DeepSeek 的新架构降低成本上表现突出,并且主要面向大集群训练、部署服务,用云提供用户服务的极致优化。而 MiniMax 的新架构,在超长文本输入方面表现优异,在 400 万的大海捞针任务(测试超长文本的任务)表现中取得全绿结果。MiniMax 观察到," 未来一年潜在 Agent 相关应用即将爆发,而 Agent 需要越来越长的 context",因此 MiniMax 在 Github 上开源了 Text-01 模型和 VL-01 模型的完整权重,在海外受到了硅谷研究员、从业者的关注。他们认为这将吸引大量的开发者和研究人员进行二次开发和创新,进一步拓展模型的应用场景和功能。Intelligence with EveryoneMiniMax 的 slogan 是与用户共创智能。虽然 MiniMax 认为 " 不是用户越多,模型能力就提升越快 ",但据 MiniMax 介绍 " 他们是国内日处理量、交互时长最高的大模型公司。" 随着产品矩阵的完善,早在去年 8 月时,MiniMax 大模型每日与全球用户的交互次数达到了 30 亿次。技术驱动,以模型技术能力边界调整产品方向的路线,贯穿 MiniMax 的始终。这里可以以 MiniMax 的产品更迭为例,MiniMax 每代产品和功能的推出背后,都吻合了当时的模型能力边界。彼时,大模型普遍面临幻觉严重的问题,在这一瓶颈下,AI 社区类 APP 无疑是当时 AI to C 产品炙手可热的方向。据 Sensor Tower 数据显示,自发布以来,海外版星野 Talkie 一直位居全球 AI 应用下载量的前 3 名。随着模型能力提升,使得 AI 生产力成为可能,MiniMax 推出了工具类产品海螺 AI,并将其作为公司重点发力的产品。MiniMax 也早早押注了多模态赛道。2024 年 8 月份,MiniMax 发布了视频模型 abab-video-1、音乐模型 abab-music-1,同时在海螺 AI 上线。据 MiniMax 介绍,视频模型上线后五周,海螺 AI 网页版访问量增速超 800%。除 C 端应用外,MiniMax 也在探索 B 端应用,面向企业客户提供大模型应用解决方案。MiniMax 开放平台主要提供 API 服务,支持的行业场景涵盖了办公协作、智能制造、数字经济、医疗、客服、智能网联。他们在算力层的部署达到了万卡级算力池。据 MiniMax 介绍,开放平台在国内拥有超 40000 家企业与开发者用户,并在海外 20 余个国家实现业务落地。而最新推出的 01 系列模型,也已经应用于海螺 AI,MiniMax 也观察到,在模型应用于海螺 AI 后," 赋予了海螺 AI 更强的通用能力,包括长文的理解和创作等。"除此之外,MiniMax-01 也在开放平台也同步上线,方便开发者和企业集成到自己的系统中。(Tips:我是虎嗅科技医疗组的王欣,关注 AI 及创投领域,行业人士交流可加微信:13206438539,请注明身份。)koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:关玉和
TOP1热点:本命年女子称穿红色内裤发现掉色并过敏,胖东来致歉承认管理存在问题
这意味着,无论是业态设置,还是装修改建,都需要经过至少县级文物部门的批准。而该公司所存的商户档案中可以看到,。
从“御翠园”的配套情况来看,该项目距离今年年底将建成的地铁3号线朝阳体育中心站约100米,周围商业配套包括国贸商圈、燕莎三里屯、丽都商圈、朝阳大悦城等。
TOP2热点:泰国总理称将全力保障中国游客来泰安全:我自己就是中国血统
8月3日,“亲海駅II”首发开盘价公布,最低折后价290万港元便可“上车”,实用面积210平方英尺(约合19.5平方米),折实每平方英尺价13810港元(约合14.87万港元/平方米),较周边二手房便宜了三成。平均来看,“亲海駅II”首批132户折实平均每平方英尺价约14997港元,创过去7年来九龙新区新盘新低水平。
TOP3热点:教育部修订《中小学生学籍管理办法》,回应了“空挂学籍”等问题脱色摇床93S
报道称,美国核管理委员会表示,拜登政府认为,这一做法对“确保美国国家安全利益、加强共同防御和安全是必要的”。一名美国官员还称,这一举措是受美对华总体政策的影响而作出的。
TOP4热点:DeepSeek推动巨头加速AI竞赛:OpenAI之后,谷歌AI大模型全面上新耕耘大婶的肥沃的土地是什么意思
日前,李嘉诚创办的长实集团旗下油塘新盘首期开盘后,以相当于周边二手房约“七折”的价格引发香港地产圈关注,并引发香港市民疯狂抢购,令市场直呼“深水炸弹”。
卢卡申科还提到:乌克兰会变得更加不同,他的领导层会变得更加谨慎、聪明、圆滑。这场冲突确实让乌克兰高层得到了历练。难道乌克兰会因为这些历练而放弃加入北约吗?
TOP5热点:勇士交易巴特勒的动力,是库里那颗不甘平庸的心天天插
这意味着,无论是业态设置,还是装修改建,都需要经过至少县级文物部门的批准。而该公司所存的商户档案中可以看到,
报道称,美国核管理委员会表示,拜登政府认为,这一做法对“确保美国国家安全利益、加强共同防御和安全是必要的”。一名美国官员还称,这一举措是受美对华总体政策的影响而作出的。
TOP6热点:四川宜宾市筠连县山体滑坡已造成10户民房被掩埋、30余人失联HDHDHDXX18
得知妻子失踪,他有没有报警呢?
据北京市住建委官网信息显示,御翠园位于北京市朝阳区姚家园东里1号院,备案名“逸翠园”,于今年7月18日获得预售证,
TOP7热点:习近平将出席哈尔滨第九届亚洲冬季运动会开幕式并举行外事活动小蓝G钙2023GGY钙202...
(原标题:快讯!泽连斯基晒与荷兰首相、战机自拍,称“达成突破性协议”)
TOP8热点:泰国总理称将全力保障中国游客来泰安全:我自己就是中国血统纯肉高
吵架后小慧就玩游戏,是她在接到一条短信后,她就出去了。
事发后,事故相关视频在网上传播,张先生看到视频才得知,这辆丰田SUV后面在其他路段又有撞车行为。据他回忆,肇事司机是一名男性,撞车的时候在冷笑,“现在想想都后怕。”
TOP9热点:突破57.79亿元!《哪吒之魔童闹海》登顶中国影史票房榜无码AV-区二区三区A片
热门综艺IP“变老”,公司又一直未能创造出新现象级综艺节目,《这!就是街舞》的体量远不如《中国好声音》。财报显示,星空华文2022年制作并播出的8档节目中,除去抖音上播放的三部,主流卫视及视频网站上播出的仍是已有知名度的IP节目。
TOP10热点:巴拿马拟终止中巴共建“一带一路”谅解备忘录,中方提出严正交涉声声入魂HIFI女声CD
日前,经中共南昌市红谷滩区委批准,南昌市红谷滩区纪委区监委对南昌市红谷滩城市投资集团有限公司原党委书记、董事长鞠雅严重违纪违法问题进行了立案审查调查。