5月7日

5月7日·周二 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

智能计算加速搜索,中国天眼FAST寻获球状星团中迄今最长周期脉冲星

近日,中国天眼FAST望远镜在球状星团M15中发现了两颗长周期脉冲星,分别为M15K和M15L,其中M15L的自转周期为3.9秒,是迄今为止在球状星团中发现的自转周期最长的脉冲星。这一发现由周登科博士领衔的研究团队完成,他们通过模拟分析红噪声影响、优化消色散软件、运用快速折叠算法等方法,从约50TB的观测数据中成功筛选出这两颗脉冲星。该成果不仅揭示了球状星团脉冲星的新演化路径,也补全了长周期脉冲星搜索的空白,对理解星团演化具有重要意义。研究团队还计划利用AI技术进一步提升搜索效率,以期发现更多长周期脉冲星。来源:微信公众号【机器之心】

速读60万字《马斯克传》、手机一键生成PPT,零一万物上线AI生产力工具「万知」

零一万物近日宣布推出专为中国人设计的一站式AI工作平台——万知,旨在通过AI技术提升个人工作效率。万知具备三大核心功能:AI知识问答、AI读文档和AI创作PPT。用户可通过网页或微信小程序接入,享受中英双语服务,且完全免费。 万知的AI知识问答功能能够快速提供精准答案,支持实时整合互联网信息;AI读文档功能能在10秒内阅读数十万字,处理复杂数据图表;AI创作PPT功能则允许用户通过手机输入主题,快速生成PPT大纲和演示文稿。李开复博士担任万知CEO,将推出系列教程并分享用户反馈。 万知的推出旨在解决现代人在“找、读、写”三大刚需中的痛点,通过AI技术简化工作流程,提升工作效率。零一万物通过海外实践,明确了AI读文档、PPT制作等高价值场景,致力于构建适合国人的AI工作平台。来源:微信公众号【机器之心】

一块钱100万token,超强MoE模型开源,性能直逼GPT-4-Turbo

DeepSeek AI 公司近日开源了一款高性能混合专家(MoE)语言模型 DeepSeek-V2,该模型在训练成本和推理效率方面具有显著优势。DeepSeek-V2 拥有 236B 参数量,支持长达 128K token 的上下文,相较于前代模型 DeepSeek 67B,新模型在性能上更强,同时训练成本降低了 42.5%,KV 缓存减少了 93.3%,最大生成吞吐量提升了 5.76 倍。在性能对比中,DeepSeek-V2 在 AlignBench 基准测试中超过了 GPT-4,接近 GPT-4-turbo,展现出在数学、代码和推理方面的专长。此外,DeepSeek-V2 在价格上具有竞争力,每百万 token 输入定价为 0.14 美元,输出定价为 0.28 美元,远低于 GPT-4-Turbo。DeepSeek-V2 采用 Transformer 架构,通过创新的 MLA 和 DeepSeekMoE 架构实现了高效的推理和经济的训练成本。模型基于 HAI-LLM 框架训练,并通过一系列优化技术减少了通信开销,提高了训练效率。实验结果显示,DeepSeek-V2 在多种英文和中文基准测试中达到了顶级性能,尤其在中文理解和对话任务中表现突出。来源:微信公众号【机器之心】

让机器准确「看懂」手物交互动作,清华大学等提出GeneOH Diffusion方法

清华大学、上海人工智能实验室和上海期智研究院的研究人员近日提出了一种名为GeneOH Diffusion的新方法,旨在提高机器对手持物体交互动作的识别准确性。该技术通过去噪处理,减少因遮挡、光线变化等因素造成的误差,使机器更准确地理解和模拟手与物体之间的交互。GeneOH Diffusion采用了一种新颖的序列表征方法和扩散模型,以增强模型对各种噪声特征的泛化能力。该研究已被国际学术会议ICLR 2024接收,并在arXiv上公开了论文和相关代码。该方法特别适用于改善增强现实(AR)、虚拟现实(VR)和机器人技术中手物交互的识别问题,对于获取自然真实的手物交互数据具有重要意义。研究人员构建了高质量的预训练语料库,并在多种数据集上展示了GeneOH Diffusion的有效性,证明了其在泛化到新的交互序列和噪声类型上的强大能力。该技术的应用前景广阔,能够提升从视频预测、运动重定向到生成模型数据质量等多个领域的性能。来源:微信公众号【机器之心】

斯坦福20亿参数端测多模态AI Agent模型大升级,手机汽车机器人都能用

斯坦福大学的NEXA AI团队近日宣布推出Octopus V3,这是全球首个超小型多模态AI Agent模型,致力于提升端侧AI应用的智能性、速度,并降低能耗及成本。该模型在参数量仅为20亿的情况下,实现了精度和延迟方面的显著提升,超越了GPT-4,并且大幅减少了推理时所需的文本量。 Octopus V3具备图像处理和多语言文本处理能力,使其能够广泛应用于智能手机、AR/VR、机器人、智能汽车等端侧设备。该模型的发布,预示着端侧设备AI应用的新时代,为用户提供了更加流畅和智能的交互体验。例如,在购物应用中,用户可以通过图像和简单的指令让AI Agent自动搜索商品;在邮件发送场景中,Octopus V3能够根据图像内容自动填写邮件。 NEXA AI团队由斯坦福大学杰出研究人员组成,其技术已申请专利保护,并在Hugging Face平台上获得了超过12000次的下载量。团队表示,将继续推动端侧AI技术的发展,并通过开源模型提升其技术的全球影响力。来源:微信公众号【量子位】

微软秘密开发首个千亿大模型,竟由OpenAI对手操刀!网友:你不要奥特曼了?

微软正在秘密开发一个内部称为MAI-1的千亿参数级别的大型人工智能模型,该模型有望与谷歌、Anthropic和OpenAI的最先进模型竞争。MAI-1由前谷歌人工智能领导者、AI初创公司Inflection的CEO穆斯塔法·苏莱曼负责监督。微软此举标志着其在AI领域追求“双重轨道”的战略,既开发小型语言模型,也开发更大、更先进的AI模型。 MAI-1预计将拥有约5000亿个参数,定位于GPT-3和GPT-4之间的级别,可能将部署在微软的数据中心,并集成到Bing和Azure等服务中。微软可能在本月晚些时候的Build开发者大会上亮相MAI-1。此外,微软在3月以6.5亿美元收购了Inflection的大部分员工和知识产权,并聘请苏莱曼领导一个新的消费者人工智能部门,这标志着微软在AI领域的重大组织转变和对生成AI热潮的利用。来源:微信公众号【AI前线、AI科技评论】

Remini背后公司Bending Spoons的并购成长之路

Remini,一款AI照片编辑应用,在五一期间因其黏土风格照片生成功能而爆火,日下载量飙升至近40万次。其背后的意大利公司Bending Spoons通过收购和并购策略,实现了1亿月活跃用户、5亿下载量,并在2023年取得了3.8亿美金的收入。Bending Spoons的并购模式包括收购具有成熟品牌和市场的产品,如视频编辑器Splice、照片编辑应用Filmic、知名应用Evernote等,并通过调整商业模式和用户体验来提升产品价值。 Bending Spoons的收购策略是保留APP而裁掉原有团队,依靠其400多名员工中的软件工程师、AI研究人员和产品经理重新开发和优化产品。这种策略使得公司能够快速扩展业务并提高收入,但也面临了如Evernote用户反馈和市场适应等挑战。Bending Spoons的成功为AI产品公司提供了一种解题思路,并展示了人工智能在推动创新和催生新一代原生产品中的重要作用。来源:微信公众号【Founder Park、经纬创投】

视频:GPT是什么?直观解释Transformer

视频:直观解释注意力机制,Transformer的核心

【今日案例】

分析新闻:中法关于人工智能和全球治理的联合声明发布

用KIMI深层解读新闻 点击链接查看和 Kimi 智能助手的对话

© 版权声明

相关文章

暂无评论

暂无评论...