看见创新力量!极客公园 2024 年度「InnoForce 50」发布
作为中国领先的创新者社区,极客公园自成立之初便与国内技术创新的浪潮同频共振,
自 2011 年 1 月首次推出 InnoAwards 以来,极客公园便致力于通过其记录和展示科技互联网领域的年度发展与变革。
「年度创新力量 TOP 50(InnoForce 50)」是「InnoAwards」精神的延续,已陪伴中国互联网走过超 10 个年头,每一年我们都从中看到新的可能。
在过去一年里,随着业界对人工智能技术的不断探索,这一轮技术与创新成果的可用度大幅度的提高,不仅通过种种产品形态深入我们的生活,以越来越细小的触角影响着每一个人;也给那些站在浪潮之巅的极客们提供了更先进可用的底层技术,使得开发者们凭借很小的团队,甚至一人之力,就能打造出成熟的产品,并获得成功。
今天,极客公园再次推出 2024 年度「InnoForce 50」,旨在发现过去一年中,在人工智能技术领域及其交叉领域实现了创新突破的产品、技术、组织、项目和个人开发者。
2024 年度「InnoForce 50」主要关注 3 个维度:创新性、实用性和社会价值增溢。
我们相信,科技的使命既是解决现实世界中的真实问题,也是仰望星空的浪漫主义梦想。因此,2024 年度「InnoForce 50」的关键词是突破、想象、以人为本——技术与商业的突破,早期但足够前沿的创新,和技术与商业的价值成长带来的社会温度。
2024 年度「InnoForce 50」不仅是对业界过去一年科学技术创新成果的认可,更是对未来创新潜力的期待。
豆包是字节跳动推出的 AI 对话助手,通过自然语言交互,豆包可以像朋友一样跟用户聊天、回答问题,豆包 PC 版则更像个人助理,帮助用户更好地工作和学习。目前在各大应用市场中,豆包 App 的月活跃用户数、用户留存率和总下载量均在 AIGC 类应用中排名第一。
在底层大模型技术栈远未收敛的 2024 年,豆包赢得了广泛的用户使用,验证了其定义的三个产品设计原则——「拟人化」、「离用户更近」和「个性化」,既满足了当下的客户的真实需求,也为用户所带来更好的体验。
以「离用户更近」的设计原则来说,豆包的产品迭代方向,致力于让豆包到用户身边,随时嵌入用户的不同使用环境中伴随用户,而不是用户到豆包身边。为此,豆包很早便发力优化语音交互体验,包括基于大模型的 ASR 和超自然的 TTS 音色,让用户都能够随时在户外语音唤起它,带来与真人对话的体验。同时,为帮助用户提升工作学习效率,豆包推出了浏览器 Web 应用、桌面客户端,以及网页插件版,让用户在读 PDF、写代码等任何场景下,都能够最终靠划词选中、截屏等方式,唤醒它帮助用户就近解决任务。
值得注意的是,今年豆包发布了首款 AI 智能体耳机 OlaFriend,用户只需直接触摸耳机或说出唤醒词「豆包豆包」,就能与它语音交流,把用户在手机里用的「豆包」App 调到耳机里,离人更近。
2024 年,豆包以模型技术驱动的产品能力,赢得用户喜爱。从其技术产品的进步速度来看,字节跳动正在大模型领域已形成了「集团化作战」的团队和资源集结,正在快速追赶全球水平。
游戏本体销量在全世界内超过 2000 万份,并获得了全球玩家一致好评。同时,《黑神话:悟空》在全球掀起了一股西游文化浪潮,成为了一个在全球产生的内容作品,让中国民间传统文化释放了全新的魅力。
《黑神话:悟空》的创造者——游戏科学公司,名字源于「游戏开发是一门需要勤奋与灵感并重的严谨学科」的寓意,这家勇于探索商业模式的公司也践行了这个原则。在《黑神话:悟空》之前,开发团队也曾产出数款在商业上已经取得成功的游戏,但开发团队没有止步于「复制商业成功」,而是坚持了创业团队创造世界级游戏作品的初始目标,在第一次 3A 游戏的尝试里,以六年磨一剑的坚持,最终交付了超越行业和用户预期《黑神话:悟空》。
游戏科学团队的成功很好地运用科技支撑了审美。团队在游戏开发中充分运用了科技的力量——比如曾在开发一年后,果断选择切换到虚幻 5 引擎平台做开发,利用虚幻 5 引擎对于 3D 扫描实景后更高效进行建模的能力,极大的提升了开发效率,并因此获得了充分的利用中国文化古迹遗产,创造世界级视觉体验的能力。同时也在传统西游文化基础之上,进行了世界观的创新设定,创造了与时代共振的故事表达,构建了引人入胜的视觉和感动人心的游戏故事。这让它成为了 2024 全球游戏行业难得一见的「清流」。也带给了游戏玩家期待已久的「更纯粹的快乐」。
《黑神话:悟空》的成功,无论是从产品创新还是游戏产业未来发展的角度,对于中国游戏领域都有着启发意义,值得作为年度创新产品给予掌声和鼓励。
今年 6 月,快手推出了首个全球用户可用的,真实影像级视觉生成大模型平台可灵 AI,展示了国内大模型技术的创新实力。
在技术上,可灵 AI 突破了传统图像生成与时序模块的局限,采用自研的 Diffusion Transformer 和 3D VAE 架构,结合高效的 3D Attention 时空建模模块与升维隐空间解码,精准建模复杂运动,生成符合运动规律的视频;采用 flow 模型替代传统 DDPM 方案,明显提高计算效率,同时通过专用语言模型优化用户输入提示词,提升视频描述质量,并支持多种控制信息输入和自回归时序扩展。这些创新使可灵 AI 在高帧率、复杂运动和多样化生成能力上树立了行业标杆。
自发布以来,可灵 AI 凭借其独特的技术特性与大范围的应用场景,持续吸引全球用户并快速迭代升级。从最初的基础功能到最新的 1.5 版本模型,可灵 AI 在画质、美感、动态质量及语义响应度上不断取得突破,为用户所带来更高水准的创作体验。其生成的视频能达到 1080p 分辨率、最长 2 分钟的高品质效果,同时支持文生视频、图生视频、一键续写及多次续写等功能。到目前为止,可灵 AI 服务用户已超 500 万,累计生成 5100 万个视频,超 1.5 亿张图片。
快手对 AI 技术的投入效率很高,除了可灵 AI,还有 π数字员工等产品也需要我们来关注。π数字员工是一款基于快意对话模型的多 Agents 协同平台,其具备全天候接待、高效服务、减少相关成本等功能,适应多行业需求,代表了快手 AI 技术的高效应用。
小米 SU7 是小米汽车推出的第一款产品,发布后迅速成为爆款,在原本并不属于热门细分市场的纯电轿车品类里,创下了 7 个月完成 10 万台交付目标的行业速度。这个超越所有人预期的结果背后也有着很多创新的思考。
在技术层面,作为电动汽车的立身之本,小米虽然入局较晚、但非常深度的参与了三电系统的研发。自主研发的超级电机小米 V8s 拥有全球最高的转速;优秀的电控能力,让小米 SU7 的能耗表现比肩特斯拉,达到行业第一梯队水准;CTB 倒置电芯技术不但可以减少电池厚度,还能在发生碰撞时最大限度保证乘员舱安全。
在智能化领域,小米 SU7 依托于小米澎湃 OS,打造出流畅的屏幕、智能语音交互体验。同时,小米 SU7 支持车内硬件和小米生态内其他硬件进行共享,进一步打通人车家全生态体验。
而在外观设计上,小米 SU7 以低风阻和高颜值作为两个重要原则,在达到 0.195 超低风阻系数的基础上,依靠极致的轮轴比、轮高比、配色方案,打造一款外观破圈的产品,甚至完成了对女性用户群的跨越,比如小米 SU7 女性用户占比达到了接近一半的比例。这是过去主流汽车产品很难实现的结果。
作为小米旗下首款智能电动汽车产品,小米在 3 年的周期内,从 0 到 1 交出了小米 SU7 这款完成度极高的产品。它不仅充分运用了小米产品定义能力的优势经验,在行业内打造了诸多创新的功能点,也充分运用了传播和品牌和销售推广上的创新思路,给整个行业带来了突破性的思考。
在目前大热的人形机器人、具身智能赛道,宇树科技是最头部的公司之一。今年团队发布了第二款人形机器人 G1,引起全行业关注。
首先是硬件性能强,如果说其去年发布的首款人形机器人 H1 拥有全球几乎规格最高的动力性能,G1 性能依然强劲,用到 23-43 个关节电机,有超越常人的灵活性;由模仿和强化学习驱动,AI 技术持续迭代;同时力控灵巧手能实现精准操作。
其次,G1 价格仅 9.9 万元,将人形机器人平均数十万、乃至百万元的价格降了下来。这背后主要是依靠团队对硬件成本的工程化控制能力。
目前,掣肘人形机器人应用落地的两大技术难点是,一是能否干活,二是成本能否下降。G1 对这两个问题做了很好的回答。因此,宇树的人形机器人本体(硬件)出货量领先,被全球各大科研机构和科技公司购买、用作研究。
H1、G1 底层技术主要迁移自宇树研发多年的四足机器狗技术。2013 年,还在读研的创始人王兴兴,自己设计电机、控制算法等,用不到两万块研发出了第一台四足机器狗 XDog。2016 年,王兴兴创立宇树科技。宇树的技术实力源于创始人的热爱与坚持,也来源于团队对技术路线的独立判断,比如宇树坚持电驱、而非主流的液压路线,被证明是更正确的。
技术之外,宇树的核心目标是做好产品、服务好用户。在务实的基础上,宇树科技一步步向人形机器人的技术星辰大海中走去。
2024 年,DeepSeek(深度求索)不断突破。DeepSeek-V2 开源 MOE 模型,上线即被视为「神秘的东方力量」,其多个模型版本在 LMSYS 全球大模型竞技场榜单上屡创佳绩,并创新性地引入了 MLA(Multi-head Latent Attention)结构,大幅度降低了推理成本。
在组织目标上,DeepSeek 致力于研究和探索 AGI 的未解之谜,以期用前沿技术推动整个 AI 生态发展。DeepSeek 以技术提升为核心,坚定选择开源路线,在商业化道路上形成了自己的风格。
当前,DeepSeek 团队体量在百人上下,但却形成了一套高效的组织创新机制。在人才招揽上,DeepSeek 强调热爱、好奇心以及扎实的基础能力。其团队的组织方式主要是自下而上。每个人带着自己独特的成长经历和想法探索,遇上问题自主协调训练集群和人才合作。只有当一个想法显示出潜力时,组织才会自上而下地组织和调配资源。举例来说,DeepSeek 引发大模型价格战的模型结构创新 MLA,最早来自一个年轻研究员的个人兴趣,后续是由组织自上而下探索验证。
在当下产业体系调整的创新环境中,DeepSeek 创新路径极具启发意义:比资本和信心更稀缺的,是如何组织高密度的人才,实现有效创新。
2024 年之前,理想汽车的智能驾驶技术曾被视为「差生」。去年,CEO 李想还在反思在智驾领域的投入偏晚。然而,进入 2024 年,理想却迅速迎头赶上,成功弥补了智驾的短板。
特别是理想智驾驶团队推出了创新的「端到端+VLM」双系统模式,类似于心理学中的「快思考」和「慢思考」的结合,可以大幅度的提高智能驾驶的反应速度与决策能力。
理想汽车的成功不仅依赖于技术创新,更源于其高效的组织架构与灵活的研发流程。借鉴华为的组织架构,理想采用了集成产品研究开发(IPD)流程+矩阵型组织架构,并结合自己特点进行了深度优化,确保各部门之间的高效协同。
同时,随只能驾驶技术路线从规则转向端到端,在数据收集、样本制作、自动化训练等领域减少了人的参与度。与此同时,理想汽车适时调整了人力配置和组织架构,形成了以 RD(Research Development)和 PD(Product Development)为核心的双轨研发体系。前者专注于下一代人工智能的发展,后者则聚焦于现存技术的量产与用户维护,确保了技术的持续进步与市场需求的快速响应。
在智能汽车迅速迭代的时代,理想智驾团队的创新思路为咱们提供了新的启示:创新的技术也需要创新的组织形态来助推,技术的革命背后需要首先用组织的成长和变化来匹配。
作为起家于农业、以农业为基本盘的公司,拼多多长期支持国内农业的发展。近两年,拼多多支持中国工程院院士、中国农业大学教授张福锁团队的「科技小院」项目,并于今年推出了「科技小院强农兴农人才教育培训行动计划」,探索公益性人才教育培训模式。
「科技小院」由张福锁和团队于 2009 年在河北省曲周县首创,是扎根生产一线的农业创新组织。目前,全国已有 157 个研究生培养单位热情参加,牵头建设了 1800 多个科技小院,覆盖 31 个省级行政区和新疆生产建设兵团。
该项目已取得初步成果。以曲周县第四疃镇下面的攻关千亩方为例,其为瘠薄、轻度盐渍化的中低产田。这一年来,在曲周各科技小院师生、各科研单位努力下,该土地实现:粮食周年亩产达 1.52 吨、较全县平均增产 42%;化肥效率 55kg/kg、增长 40%、减排 46%;水分利用效率 2.16kg/m³、节水 30%;亩节本增收 795 元。
在连续两届支持科技小院大赛之外,拼多多还帮助各地科技小院重点支持的农产品打造成爆品,送往千家万户。例如,科技小院重点研究的丹棱桔橙「爱媛 38 号」,近年来在拼多多平台打开销路,当地不少果农开起了线上店铺,直接服务消费者。
「科技小院」项目是学界和产业的双向合作,推动了我国农业的供给侧升级和高质量发展。
flomo 浮墨笔记在 2024 年的产品更新中,成功运用大模型技术实现了更智能的笔记分析与管理,使其在同类笔记产品中获得了优秀的用户口碑。
flomo 诞生之初的目的是在全平台支持用户随时随地记录想法。它允许用户通过微信、App、网页等多种渠道,快速捕捉灵感,无需担心格式差异,保持笔记的实时更新。
2024 年其更新的「相关笔记」和「找一找」功能,让笔记的回顾和整理变得井然有序。「相关笔记」通过深度学习分析用户记录,以单条笔记为出发点,智能推荐笔记库中与之有内在关联的其它笔记;「找一找」则是以提问的方式挖掘过往的笔记内容。其背后的 AI 技术是让 flomo 脱颖而出的关键。这种「学习」和「理解」的能力,使得 flomo 能够主动建立知识间的联系,让个人知识库不再是静态的积累,而是能够动态地支持用户的创新和决策。
同时,利用 API,flomo 与阅读软件等应用联动,极大扩展了笔记的应用场景。
flomo,在良好的产品设计和交互设计基础上,合理地运用了大模型技术,让用户的思维碎片从深度和广度上得到链接与扩展,释放了笔记产品更多潜力,在个人知识管理工具中,为用户交付了更高的产品价值。
Monica 作为一款 All-in-One 的 AI 助手,主要以浏览器插件的产品形态,实现了 AI 功能的分发。在 AI 技术栈远未收敛的今天,Monica 精准切中了当下的客户的真实需求:在既有场景里用 AI 优化流程和使用者真实的体验。Monica 致力于把大模型「低垂的果实」和用户场景理解到极致,将最趁手的 AI 体验第一时间带给用户。
2024 年,Monica 以「速度」刷新使用者真实的体验和价值。在 GPT-4o、Claude 3.5、OpenAI o1 系列上线的第一时间,用户即可通过 Monica 解锁最新 SOTA 模型,用上新模型驱动下的网页内容新交互。比如随着接入模型的新进展,Monica 的专业搜索、DIY Bot、Artifacts 写小程序、记忆等功能深受用户喜爱。
同时,Monica 以对用户场景的深入研究见长,以满足在用户特定场景下的痛点和个性化体验。比如 Monica 在 YouTube、Twitter、Gmail、The Information 等不同功能的网页里呈现出不同的交互形态和功能,以适配特定场景的客户的真实需求,今年已更新数百个网页的个性化 AI 体验。同时,Monica 也支持用户自行修改默认配置,以满足个人的最佳使用习惯。
功能更新快、场景积累深厚、基于用户的个性化迭代,Monica 在信息获取和处理上带来了高效的体验,也赢得了用户的喜爱。2024 年,Monica 用户数量翻番,达 1000 万。同时,其保持着可观的盈利,在海外同种类型的产品中,位居头部。Monica 的表现验证了在当下,套壳到极致,既是 TPF、也是 PMF,最后都通往用户价值。
BaaS 电池租用服务是蔚来为用户更好的提供的一种创新的电池租赁服务,该服务允许将车辆和电池分离购买,旨在降低购车门槛,提高了产品竞争力,同时推动电池管理和健康保障,进一步减少能源浪费和环境污染。
BaaS 服务最早于 2020 年推出,作为一种创新的服务型产品,它可以依托于蔚来独有的换电体系,为用户更好的提供差异化购车和补能体验。但也正因为前期需要投入大量资源建设换电站,蔚来换电体系曾在初期遭受到行业质疑。
2024 年,蔚来已在全国布局超过 2600 座换电站,第四代换电站最快可实现 2.5 分钟满电出发的补能体验。同时,「可充可换可升级」的服务体系,允许用户日常选择标准容量电池,长途出行选择更大容量电池。目前,超过 95% 的蔚来用户在购车时选择了标准续航电池版本,逐步降低购车成本的同时,也能够尽可能的防止能源浪费。
本年度,蔚来公司连续 6 个月销量突破 2 万台,蔚来长期在补能领域的研发和创新,终于兑现成了体系化的优势,超 7 成用户在新购车了选择了 BaaS 方案。BaaS 的推广,既为用户更好的提供了智能电动汽车时代更灵活的购车方式,也让蔚来换电的体系化优势进一步凸显。
作为最早系统性投入研发物理世界 AGI 的公司之一,智平方 2024 年推出了 Alpha Bot 机器人解决方案,成为最早进行商业化推广的智能机器人公司之一。
智平方推出的通用智能机器人 Alpha Bot 系列,可以像人类一样迅速适应新环境,灵活执行多种任务操作。
其背后搭载的是智平方全栈自研的端到端具身大模型 AI2 Brain。智平方通过自有数据、原创模型结构与训练方法,在空间智能基础模型方面取得了显著的技术进展,为 AI2R Brain 提供了无与伦比的空间感知能力;加上独特的端到端架构设计优化以及软硬垂直整合技术,在非结构化场景中,AI2R Brain 的泛化任务成功率业界领先,其端侧工作速度也在全球领先。
目前,智平方推出的 AI2R Brain MaaS 服务与 Alpha Bot 机器人解决方案已得到头部互联网公司、国际头部车企等行业客户的技术认证。
智平方由国家创新领军郭彦东博士创建,核心团队有多年硬核 AI 原创研发经验、智能硬件主机厂大规模量产经验。团队致力于构建一个可拓展的机器人体系,解决智能机器人在广泛、多样的真实场景中进行规模化交付的世界难题。
2024 年,凭借 AI 技术上的创新突破,重构为一站式 AI 内容获取和创作平台,提升用户创作效率的同时,逐步推动了内容创作的智能化转型。
除了 14 亿专业文档之外,基于文心大模型,推出智能 PPT、智能文档、行业研究报告、AI 全网搜索、智能有声画本、智能漫画等上百项 AI 功能,覆盖学习办公、家庭教育、兼职赚钱场景。
截至 2024 年 10 月, AI 用户数累计超 2.3 亿,AI 功能累计使用次数超 28 亿。
与百度网盘也全面融合,在两个产品原有优势上实现了进一步打通、重构,并发布了 AI 创作新物种「自由画布」,后者不仅突破了内容创作的传统界限,还推动了公域与私域内容的自由流动,为用户更好的提供从内容生产到消费的全流程服务。
通过技术赋能,为个体提供了更多创作与就业机会,促进了更广大人群的创作能力提升。
海螺 AI 是国内头部的大模型公司 MiniMax 旗下生产力产品。通过 MiniMax 出色的语言大模型,海螺 AI 能实现对话、文档理解、图片识别、文本写作等功能。
尤为特别的是,在国内的生产力工具里,海螺 AI 是率先推出语音交互功能的,口音逼近人声、低延时,交互流畅自然,比 GPT-4o 做得更早、效果出色。
此外,今年 9 月海螺 AI 又上线了文生视频功能,对标 Sora,产品表现力在国内产品中处于上乘,核心在于指令跟随、对高动态信息的表现力、以及视频的高分辨率和高帧率等。国内外不少用户使用该功能,做出了逼近电影大片的效果,用户反响很好。
这反映了该公司的多模态(文本、语音、视频等)产品策略,它相信每扩展一种模态、用户的渗透率会随之提高,而让大模型真正被普通人用起来,正是该公司的愿景。
作为最早成立的大模型公司之一,MiniMax 坚持技术和产品双轮驱动,认为技术决定产品、产品又会助力技术。除了海螺 AI 外,MiniMax 底层模型技术还支撑另一款重要产品「星野」,其主打虚拟社交、为用户更好的提供情绪和陪伴价值。
凭借在长文本处理、效率工具、以及搜索助手方面的持续投入和功能更新,Kimi 智能助手在 2024 年聚焦生产力场景,成功在众多 AI 助手中打造出了自身的独特辨识度。
Kimi 通过支持上传超长文本文档,并快速对文字进行摘要、搜索、翻译、答疑等操作,首先在学术科研人士、互联网从业者和内容创作者等对于文本处理要求比较高的行业人士中,产生了口碑传播。
2024 年,Kimi 逐步加强了其长板,在上半年更新了 200 万汉字的无损上下文功能,相当于能够一次性看完四大名著。下半年,Kimi 更新了搜索功能,利用其长上下文的优势,以及通过提升 AI 的深度思考能力,通过理解、拆解问题,Kimi 一次搜索可以阅读五百个网页界面,为用户更好的提供更好的搜索结果。
2024 年 5 月,Kimi 还尝试了 AI 原生应用的商业化探索。当用户量激增、推理出现高并发时,系统会弹出打赏界面,引导用户付费支持。利用用户友好的产品设计,这一商业化尝试并没有引发用户的反感,反而得到一定的支持,是中国原生 AI 应用商业化的一次积极尝试。
在头部的大模型公司中,Kimi 是最坚定地投入 C 端策略的公司之一。但对于普通用户而言,分清各家 AI 助手的能力如何,实际上并不容易。通过坚定的战略投入,用户友好的体验优化,和以「长文本处理」作为核心特色,Kimi 成功获得了一批自己的忠实用户,并成功塑造了独有的用户认知。
2024 年年初推出的秘塔 AI 搜索,推出不到两个月,就获得了数百万访问量,到 2024 年下半年,已经稳居国内 AI 应用访问量前列,表现出色。
颠覆了过去搜索引擎的形态,在秘塔 AI 搜索中,用户输入问题后可以直接得到答案,而不是去浩如烟海的网页中自己阅读和判断。
这是典型的这波生成式 AI 出现后才能成立的场景。秘塔 AI 搜索自建了网页索引库,在用户提出搜索词后,以自己的算法找到关联的网页,再使用 AI 总结搜索到的网页,交叉验证,直接给出最后的结论。
自研了百亿参数的小模型,秘塔率先在 AI 推理成本和 AI 应用能力上做到了相对平衡。通过对用户的搜索需求来做简洁、深入和研究三层分级,秘塔进一步分化客户的真实需求,深入、研究层级能自动呈现相关事件等更多详细的信息,而简洁模式通常只有一段回答。
在 2024 年一年中,秘塔 AI 搜索还逐步扩大了搜索范围,目前可搜索范围除了网页还包括学术网站、播客和文库,并上线了图片分析、AI 辅助撰写研究报告、专题知识库的功能。
在搜索这个公认更适合大厂参与的领域,秘塔 AI 搜索利用新的 AI 技术对搜索带来的变革,带来了新的使用者真实的体验,获得了一批稳定使用其搜索服务的用户,成为了 2024 年最被认可的 AI 原生应用之一。
新上线不久的纳米搜索,基于 360AI 搜索在 AI 搜索领域的积累,展示出了很强的产品能力,迅速成为了国内 AI 搜索的突出力量之一。第三方平台多个方面数据显示,360 AI 搜索单月最高访问量突破 3 亿。
AI 搜索是此次生成式 AI 革命中的重要原生应用场景,但对于 C 端用户而言,存在着产品同质化的问题。
不同于其他仅提供简单答案的 AI 搜索,纳米搜索作为全新的「多模态内容创作引擎」,以「搜学写创」为核心能力,实现了多种场景的「AI 生产闭环」。其技术创新与应用包括,构建 CoE 专家协同技术架构提升多语言和多模态搜索能力、引入多模型协作与慢思考模式大幅拓展了 AI 搜索的功能和应用深度。
比如多模型协作模式,可以让不同大模型接力回答用户问题,引入一个大模型对另一个大模型的回答进行判断,再引入另外的大模型进行总结处理。模型接力的方式新颖有趣,纳米搜索利用了多家大模型公司的综合能力,用属于 AI 原生产品的构筑方式,真正提升了用户获得答案的质量。
在搜索领域深耕多年,360 已经搭建起涵盖千亿网页与专属知识库的庞大索引库,拥有强有力的数据护城河,同时 360 自建了万卡 GPU 算力集群,结合 100 多座数据中心、10 万多台服务器,构筑了坚固的算力护城河。
凭借着「360 安全卫士」以及「360 系浏览器」在国内的用户基础和强大的产品更新能力,纳米搜索有机会为更广大的用户所带来全新的智能搜索体验。
支付宝旗下 AI 生活管家「支小宝」作为服务型的 AI 原生应用,开创性地以对话式交互重塑了用户与服务的连接。
「支小宝」以 AI 为核心,通过连接支付宝丰富的生态系统,为用户更好的提供了涵盖点餐打车、订票挂号及查询附近吃喝玩乐等一站式便捷服务。其场景感知系统可以依据用户的生活习惯及特定时间、空间智能推荐专属服务,真正做到「越用越懂你」。
目前,「支小宝」已累计服务 1.5 亿用户,并延展至出行、政务等领域,推出多个专业智能体,如乌镇峰会智能体「桐小乌」、黄山景区文旅智能体「黄小松」等,通过与智能体的连接,「支小宝」为用户创造便捷的生活服务体验。
「支小宝」背后是蚂蚁百灵大模型的强大技术,其在对话式 AI 交互中的应用,不仅突破了传统图形用户界面的限制,更率先在行业内实现了生成式 AI 能力的生活化落地。在日常生活中,「支小宝」能感知用户场景,记住通勤、饮食、娱乐等习惯,在不同时间节点提供定制化的智能服务。早上提醒带伞、地铁站调出乘车码、午餐时间推荐餐厅,甚至规划周末出游攻略——「支小宝」以独特的「AI 陪伴」模式,在点滴之间渗透到用户生活中,成为高效贴心的数字管家。
作为 AI 原生产品的典范,「支小宝」不仅展示了支付宝对 AI 场景化应用的深刻理解,也成为行业探索「拼应用」的最佳实践。以支小宝为起点,蚂蚁集团的 AI First 战略正引领 AI 服务生态走向未来,为用户带来更加丰富、多元的智能化体验。
成立于 2023 年的 AI 应用开发框架 Dify,一直是一个对开发者颇有帮助的开发平台。其在 2024 年更新功能后,在开发者中受到了更多的关注和好评。
灵活构建、可靠调试新兴的 AI 应用,对于传统应用开发者来说是一个全新的挑战。为了解决这一问题,Dify 集成了数百种大语言模型,为 AI 应用开发者提供了许多开箱即用的工具,让对大语言模型不够熟悉的开发者,也能经过简单的调试,设计出属于自己的 AI 工具。
2024 年,Dify 更新的 AI agent、AI workflow 功能,设计出了流程化的方式,补齐目前 AI 应用开发开发的短板。开发者不必再依赖特定大模型提供的有限工具开发 AI 应用,而是可以通过拖拽、点选等简单的操作,在 AI 不同的工作节点中利用不同模型能力优势,以及多种外部工具来实现丰富的能力,制造出可复制、迁移的应用。
方便的导入、导出功能,让 Dify 在开发者中广受欢迎,开发者可以在彼此 Dify 的工作流基础上,进一步构建自己的应用。AI 开发者社群中,甚至出现了专门围绕 Dify 设置的 AI 开发课程、AI 开发比赛和 AI 应用社区。
Dify,作为一个开源、中立的工具,让开发者避免了重复造轮子,提升了开发者的生产效率,也在某种程度上,让今年的 AI 应用开发生态更加繁荣。
硅基流动是国内 AI 基础设施方向的创业公司,团队专注为生成式 AI 开发者和企业打造高效能 AI 基础设施平台,通过算法、系统和硬件的协同创新,跨数量级降低大模型开发门槛与应用成本,加速 AGI 进程。
团队推出的大模型云服务平台 SiliconCloud,提供极速响应、价格亲民、品类齐全、体验丝滑的模型服务,可让生成式 AI 开发者与企业能够零门槛开发和使用模型,实现应用需求方和开发者能力的快速对接。
SiliconCloud 不仅上线了数十款全球最新、最强大的开源模型,还通过自研推理引擎套件(SiliconLLM & OneDiff)大大降低大模型推理成本,用技术让开发者实现 Token 自由。
公司自研的 SiliconLLM 大模型推理引擎,通过内核、框架、机制和模型协同优化,使得推理效率达到业内 SOTA,响应速度较同类开源产品最快达 10 倍以上,同时在 MoE(混合专家)架构、超长上下文、超低延迟等要求严苛、需求复杂的推理场景达到业界领先的产品能力。
SiliconCloud 公测上线一个月便获得了爆发式增长,平台用户日均调用数百亿 Token,受到众多 AI 开发者和企业客户的青睐。
硅基流动,用 AI Infra 技术降低了 AI 算力的成本,为生成式 AI 开发者与企业在「生产力」层面提供快速助力,实现 AI 的快速普及。
硅基智能是一家专注于数字人领域的科技创业公司,在 AI 时代,团队利用自研的炎帝大模型让数字人快速落地各种商业场景。
2024 年底,硅基智能推出全球首个具备感知能力的多模态大模型 DUIX ONE,实现了 AI 数字人「看得见、听得见、会思考、高情商、有具身形象」的全感知能力。当 AI 数字人通过观察到用户表情和动作,能更好地捕捉用户情绪波动,给用户带来更真实和更具深度的连接。
基于 DUIX ONE 多模态⼤模型技术的核⼼成果,硅基智能创始人成为全球首位将自己硅基化的 CEO,同时硅基智能也面向用户推出了个人数字分身服务,可实现「语⾳识别、情感理解、智能互动、能看会听多模态能⼒」的⾼度融合,为⽤户提供数字化⼈格的构建。某种意义上,该服务展示了「数字永生」的可能性。
通过大模型 + 数字人技术,硅基智能已将数字人产品在十多个行业、数十个商业化场景成功落地,加速了数字人业务的进化和市场开拓。
作为一款基于讯飞星火4.0 Turbo 技术的创新 AI 智能文档工具,讯飞智文彻底改变了传统 PPT 制作的方式,将办公效率提升到全新的高度。
多种生成方式任你选择;大模型联网搜索,内容丰富、结构清晰、时效为先;AI 文生图输入想法即可生成高清图片,解决配图难题、避免版权问题;在线编辑模组自由定制,操作灵活,一站式的创作流程迅速提升工作效率。
讯飞智文作为大模型时代下的数字生产力工具,不仅实现了技术创新,更紧贴用户需求,在职场、教育、商务等多个场景中都能提供实际的帮助,成为个人和团队提升工作效率与创作质量的好帮手。
有赞新零售是有赞旗下智能化消费者运营解决方案,致力于通过全域客户精细化运营,帮助品牌零售商深挖客户全生命周期价值,提升老客户复购率。
在存量经济时代,全域经营成为吸引消费者的关键。有赞新零售推出了一体化产品组合,打造「连接-触达-转化-忠诚」消费者旅程可复制的运营方法论,全维度整合消费者数据形成精准客户画像,开展自动化精准营销和会员增值营销,帮助商家提升复购率、客单价和客户转化率,实现全生命周期、全场景、全链路业绩提升。
另外,借助企业微信助手和导购助手等数字化工具,商家能够高效沉淀私域流量,并实现高效转化,推动新零售模式下的业务增长与品牌价值提升。
2024 年,在 AI 的加持下,有赞新零售把导购产品升级为「智能导购」,通过帮助导购发现精准商机,指导导购营销和维护客户,帮助每位导购每个月多做 2500 元业绩,获得利润增量。凭借其全域经营与智能化运营的独特优势,有赞新零售不仅推动了商家的成功转型,也为新零售模式的未来发展奠定基础。
在 2024 年,纵苇科技以其在智能制造领域的创新自研和卓越的市场表现,成功引领了生产力的新浪潮。
纵苇科技的成绩,首先体现在其产品的创新性上。智能磁驱系统作为纵苇科技的核心产品,底层算法由纵苇科技全自研开发,是国内柔性制造领域的先锋产品。公司不仅实现了产品的国产化,更在技术上实现了对欧美同类产品的超越。
纵苇科技的市场表现同样令人瞩目。在成立后短短三年内,实现了客户数量从 0 到 100+家的飞跃。公司产品已成熟应用于新能源电池、3C 电子、汽车零部件、消费品和医疗等多个行业领域的头部客户,积累了丰富的标杆客户交付案例和全球化的产品交付经验。2024 年,纵苇科技订单规模实现一倍以上增长,客户数量增长 3-4 倍,更为重要的是,纵苇科技切实地帮助客户实现了显著的降本增效。
公司通过磁驱输送技术的创新应用,全流程数控实现数据留存,以及将一次性设计的生产线变成模块化复用,可以将设备生产节拍提升 2-10 倍以上,精度达到 5 微米级别,同时为客户节省大量运营维护成本。
今年,纵苇科技在香港、新加坡、韩国、越南、泰国、德国等地先后开设研发生产及服务中心,以期实现业务增长并进一步扩大全球影响力。
纵苇科技以其在工业自动化领域的创新突破、快速的商业化进程以及对客户降本增效的显著贡献,不仅在技术上实现了国产化,更在全球市场上展现了中国智造的力量,其卓越的表现无疑是对「数字生产力」的最佳诠释。
一车多用,随时变形,汽车圈一个近乎科幻的难题,被长安启源 E07 破解了。这辆能在 SUV 和皮卡两种车型之间随意「流动」的产品,给爱车的人带来了极大惊喜。
作为一款颇具科幻感的新能源 SUV,通过可移动的后挡风玻璃、可下翻挡板设计,让长安启源 E07 可以在几秒钟内从一台城市 SUV,变形成一台真正能作为生产力的的皮卡车。
为了达到「变形金刚」的效果,长安团队需要重构车身结构和比例,精细地设计两段式开启的后挡风玻璃以及下翻式尾门,在确保皮卡形态可用的情况下,仍要保证车辆在造型、耐用和安全性上不妥协。同时,顶配版 440KW 的双电机、空气悬挂+CDC 智能魔毯悬挂的组合,也让车辆在动力、操控和驾乘享受上得到极大提升。「可城可野」、「可享受可拉货」,不再是空谈。
设计和结构上的巧思、更重要的,团队在打造一辆用户需要但甚至不太敢想的产品上的义无反顾,是长安启源 E07 获得 2024 年度汽车产品的资格和底气。
越野,已经成为中国新能源车的新战场。长城的坦克系列,是中国越野车型的先行者。
2024年长城推出了坦克 500 Hi4-Z,通过动力、布局和结构件上的创新,让新能源越野车的标准再次升级。
为让带「大梁」的硬派越野车能覆盖全部工况,长城 Hi4-Z 通过采用功率分流+三挡前驱模块的高集成创新设计,双电机分布式布置,解决发动机功率分流难题。在结构方面,Hi4-Z 的研发团队成功研发出全球集成度最高的泛越野变速箱及动力电池系统。在硬件布置上, Hi4-Z 搭载前后桥机械差速锁,物理加持实现前后轴各自的绝对同转,拉高泛越野的脱困能力上限。
动力方面,坦克 500 Hi4-Z 搭载 2.0T 发动机和前后大功率驱动电机,三擎联动,可实现百公里加速 4.6 秒;纯电续航里程 WLTC 201 公里,完美做到「一周只充一次电,一次就能开一周」,综合续航近 1100 公里;得益于功率分流 3 挡的前驱模块,发动机可以做到全速域的高效直驱。
搭配高水准的智能座舱系统,以及精心打造的内饰,坦克 500 Hi4-Z 坐实了覆盖越野和城市的「泛越野新能源 SUV」概念,通过技术满足了用户对于旷野的想象,和对舒适、节能与安全的保证。
A0 级纯电小车市场的产品,一直是廉价、凑合的代名词。 吉利星愿以优秀的动力配置、充足的内外空间以及高水准的车机,将 A0 级汽车市场标准提高到令人吃惊的程度。
作为一款定价 8 万元左右、长度 4 米 1 的纯电小车,吉利星愿并没有因为车型定位而进行减配,反而通过巧思在空间、设计和智能等方方面面,让产品成为媲美 A 级轿车、但同时又能在城市通勤的利器。
4 米 4 以下的小型车,往往因为尺寸问题导致产品在空间、动力和配置上差强人意。为了创造足够的驾乘空间,吉利团队将电驱和电机后置,对车辆底盘进行重构,改动小到空调和滤芯的位置也不放过,最终让星愿拥有了媲美 A 级轿车的内部空间、70L 的前备箱和 375L 的后备箱。搭配银河 Flyme Auto 智能座舱、85KW 电机以及后独立悬架,让吉利星愿无论在智能交互还是驾驶操控上,都达到了令人意外的水平。
不将就,真正从用户角度和行业痛点解决出发,通过重构底盘和车身结构,打造出超出人们期望的 A0 级纯电小车,这是吉利星愿获得 2024 年度汽车产品的根本原因。
进入 2024 年,中国品牌在豪华 SUV 和 MPV 市场站稳脚跟,但轿车尚未突破。浑身黑科技的腾势 Z9GT,是中国品牌冲击豪华轿车市场的又一次尝试。
腾势成立于 2010 年,定位高端电动汽车制造商,最开始股东为比亚迪和戴姆勒(各持 50%),目前已成为比亚迪全资子公司。Z9GT 是腾势「Z」系列的首款车型,采用轿跑 GT 的设计风格,定位为「D 级智能豪华旗舰 GT」,并全球首搭比亚迪自研的「易三方」整车智能控制技术平台。
多年的持续研发,使比亚迪积累了丰富的技术储备,腾势 Z9GT 首搭的「易三方」技术平台便是最新成果之一。易三方全球首创三电机独立驱动与后轮双电机独立转向。其中,三电机独立驱动系统提供最大功率接近 1000 匹马力,使腾势 Z9GT 能够以 3 秒级完成百公里加速。同时,后双电机的扭矩主动控制能力与后轮双电机独立转向系统相结合,通过融合控制可以实现如圆规掉头、低附路面增稳系统和智能蟹行等多项智能功能。不仅如此,腾势 Z9GT 的最小转弯半径仅为 4.62 米,尽管车身长度近 5.2 米,但其转向灵活性甚至超过了小型 A0 级车。
腾势 Z9GT 的发布,不仅在产品创新层面具有突破性意义,更为中国车企的品牌向上跃迁提供了重要启示。这一车型的成功值得获得年度汽车产品的认可与赞誉。
小鹏 MONA M03 是 2024 年上市的一款新车。在 10-15 万元价格区间,它首次搭载了多项越级的智能化功能,重新定义了 A 级智能轿车的标准。同时,上市后首月交付即破万,成为本年度竞争激烈的智能电动车市场中,通过技术下放带动市场销量的典型代表。
小鹏 MONA M03 用多指飞屏、四音区独立语音控制等功能,取代了传统的车内交互形式,带来更加便捷和智能的座舱体验。在智能驾驶层面,标准版即搭载同级唯一的全场景智能泊车系统,让停车变得轻松高效;顶配版更是支持不限城市、不限路线的 XNGP 高阶智能辅助驾驶,首次将 L2+级别高阶智驾下放至 A 级车型。
早在 2022 年,小鹏就和阿里云在自动驾驶算力上合作,将自动驾驶模型训练效率提升 600 倍。2024 年,小鹏全面拥抱基于 AI 的端到端智驾开发范式,发布了全新一代「AI 鹰眼视觉方案」,用视觉感知模块实现了和激光雷达同等的体验,实现技术降本。同时,自研芯片「小鹏图灵」成功流片,也为下一步在智驾安全、车端大模型等提供了更强的计算储备。
这一年,中国新能源车市场渗透率来到 50%,智能化竞争将成为未来 10 年的角力重点。小鹏 MONA M03 是其中一个通过技术降本,从而将智能化下放并获得市场认可的成功创新案例。
DJI Neo 是大疆在空拍机领域为解决纯小白新手「畏难情绪」和「选择困难」两大难题而推出的性价比之作。作为一款性能强劲的掌上无人机,DJI Neo 引发了行业的广泛关注。
DJI Neo 仅重 135g,主打零门槛掌上起降,无需遥控器也可轻松完成拍摄;其搭载了 AI 智能算法,能跟随取景框中的对象,带来智能跟拍玩法。同时,DJI Neo 支持多种操控方式,既可以无遥控飞行拍摄,也可像普通航拍机一样搭配遥控器使用;也可搭配穿越摇杆、飞行眼镜,感受第一视角飞行体验的魅力。
DJI Neo 的定价显著低于同级别专业无人机,延续了大疆在硬件成本控制上的行业优势。这让更多用户能轻松享受到无人机技术给生活带来的乐趣。
目前,手持小型无人机领域的两大挑战,在于复杂环境下的飞控稳定性以及价格如何打动更多用户。DJI Neo 对这两个痛点提供了清晰的答案。
DJI Neo 体现了大疆深耕无人机技术的同时对用户需求的深刻洞察,同时也延续了其通过技术创新助力创作自由的愿景。在无人机的技术蓝海,通过 DJI Neo,我们看到了 Vlog 拍摄的更多可能。
在折叠屏技术日趋成熟的背景下,「如何做好一部让人眼前一亮的手机」却成为了新时代的难题,而华为 Mate XT 非凡大师无疑是中国手机品牌在 2024 年最有代表性的回答。
通过在大屏态下对易用性的深度打磨,同时提升折叠状态下的便捷体验,使得华为 Mate XT 非凡大师的整体体验更加全面。
得益于这种设计思路,华为 Mate XT 非凡大师采用了业内领先的铰链技术,使屏幕观感自然且耐用。无论在展开或折叠状态下,用户都可以无缝切换使用各种应用,打破了移动终端的使用边界,为日常生活和办公场景提供了全新的操作体验。
借助华为 Mate XT 非凡大师的多任务处理能力,让用户可以同时运行多个应用,高效处理各种信息需求。此外,华为还充分利用折叠屏的特性,提供了更符合用户直觉的交互体验。
2024 年,折叠屏手机已然成为未来智能设备发展的重要趋势。华为 Mate XT 非凡大师在保持硬件创新的基础上,成功将移动设备形态推向了一个新的高度,为未来多样化的智能设备形态铺平了道路。
界环 AI 音频眼镜是一款将眼镜、耳机、AI 大模型等结合在一起的全新形态的智能音频硬件。
不同于其他同品类 AI 硬件的探索,界环 AI 音频眼镜把「先好做一副眼镜」作为了最重要的产品优先级。团队重点对产品在轻量化、长续航、时尚感等多个方面进行了打磨,佩戴体验感、产品售价均接近传统眼镜。
得益于上述设计原则,产品的日均佩戴时长超过 7.2 小时,媲美智能手机的使用时间,加上独特的佩戴位置,让眼镜可以通过音频形式进行更智能的交互,为 AI 大模型接入硬件提供了先决条件和应用场景。
界环推出的 AI 通知播报功能,通过调取手机中相关应用数据,通过大模型进行筛选、总结、归纳,让海量通知既可以做到「长短短说、废话少说」,又能依托音频形式高效、实时传递,在过往基于视觉的交互上,开拓了新的以语音互动为主的 VUI 全新交互范式。
同时,界环不仅可以做到线上配镜开箱即用的服务,也在线 家门店,为这款智能硬件提供了堪比传统眼镜的配镜服务,大幅降低了购买门槛。
2024 年,「AI+眼镜」成为新形态 AI 硬件探索中的一个共识方向。界环 AI 音频眼镜在做好用户服务的基础上,将 AI 大模型的能力成功接入可穿戴设备,并为未来提供了更多可能。
2024 年, AI 手机迅速成为硬件主流赛道,OPPO Find X8 Pro 是其中最引人瞩目的产品之一。
在 Find X8 系列上,OPPO 用自己的产品哲学,向行业公布了「打造一台好用的 AI 手机」的配方:支持端侧 AI 能力的硬件 + 收纳完善 AI 能力的系统生态。
作为 AI 能力的基座,ColorOS 15 为各种 AI 提供了协同的智能调度能力,确保 AI 功能高效流畅运行;同时按照每个用户使用习惯自我学习,自动提供诸如 AI 一键问屏、 AI 千里长焦等个性化的操作体验。
更重要的是,Find X8 Pro 通过 ColorOS 15 与硬件深度协同,实现了优秀的软硬一体化 AI 体验。比如基于 AI 的智慧屏幕显示与隐私保护功能,不仅实用且贴合用户使用习惯。
Find X8 Pro 之所以在市场中独树一帜,不仅因为其完善的 AI 能力,更因为 OPPO 在产品打磨与用户体验上的坚持,充分展现了对智能手机未来发展的深刻洞察,是一款真正「超越用户期待」的 AI 手机。
以「骨气双单元」为底层技术,韶音 OpenRun Pro 2 引领了运动耳机的新风潮。作为 2024 年运动音频设备领域的突出产品,韶音 OpenRun Pro 2 体现了运动耳机设计与技术创新的结合。
这不仅是一款耳机,更是一种倡导运动与健康生活方式的科技实践。OpenRun Pro 2 的亮点在于对开放式声学技术的深度优化。它采用韶音自研的 DualPitch 骨气双单元技术,通过数字分频技术发声,采用骨传导单元发出中高频声音,定向声场低音单元发出气传导低频声音,突破了传统运动耳机音质的局限,为用户所带来更加清晰、饱满且富有层次感的听感体验。延续开放式设计的安全优势,用户在跑步、骑行时依然能感知周围环境,从容应对复杂场景。
为了满足运动人群的需求,耳机采用了符合人体工学的设计,极致轻量化及贴合性让长时间佩戴几乎无负担。在产品研发中,「音质细节」「运动体验」成为了 OpenRun Pro 2 的两大关键词。开发团队捕捉到用户的核心需求,如更优质音效、更长续航,并快速通过用户反馈改进产品细节。
尤其在续航方面,OpenRun Pro 2 支持长达 12 小时的持续播放,结合快充功能,进一步解决了高频使用者的电量焦虑。此外,OpenRun Pro 2 支持 IP55 级防护,不论是日常通勤还是专业训练,它都能成为可靠的运动伙伴,在极限运动环境下也表现出色。
作为 2024 运动耳机领域的重要新品,OpenRun Pro 2 重新定义了运动耳机的边界:它不仅满足了用户对音质和佩戴体验的极致追求,还进一步探索了科技助力生活方式转变的可能性,成为运动科技产品领域的标杆之作。
进入 2024 年,智能驾驶的竞争焦点已从拼算力、拼算法转向全场景落地,地平线是首个推出软硬一体智驾方案的公司。
Horizon SuperDrive(简称 HSD)是地平线面向下一代全场景高阶智驾系统打造的产品。依托端到端的世界模型、数据驱动的交互博弈以及专为下一代高阶智驾而生的征程 6,HSD 不止拥有高度拟人的优雅从容姿态、超强通行效率,更能提供全国一致的极致智驾体验,让用户享受体验无断点、模式无切换、全场景无差别的安全美好出行。
这背后主要得益于地平线原生的软硬结合优势,以及特有的「铁人三项」(技术+工程+产品)系统能力。早在 2016 年,地平线便提出了无人驾驶端到端演进理念,并持续取得技术创新与突破:2022 年推出感知端到端算法 Sparse4D;2023 年地平线学者提出 UniAD 端到端大模型,并荣获 CVPR 2023 最佳论文奖。SuperDrive 依托地平线软硬结合的技术优势,以及强大的系统工程能力,帮助车企实现更高效的高阶智驾规模化量产。
地平线 SuperDrive 方案,通过软硬件的技术突破,实现了高效的全栈计算,为智驾的规模化落地提供了高度适配的解决方案,值得年度技术突破奖项的认可与赞赏。
2024 年 9 月 11 日,蓝箭航天在酒泉卫星发射中心成功完成了朱雀三号 VTVL-1 试验箭的 10 公里级垂直起降返回飞行试验。这是国内首次实现火箭发动机空中二次起动、跨音速大动压环境下「栅格舵-冷气姿控-发动机」联合制导控制,以及高空风实时风修技术验证,使得中国商业航天在可重复使用运载火箭技术上取得了重大突破。
蓝箭航天空间科技股份有限公司(蓝箭航天)是一