杭州市拱墅区建设局网站,界面好看的网站,网易企业邮箱小程序,微讯信息群号1000000写在前面#xff1a;10月份的时候#xff0c;联发科天玑9400发布#xff0c;搭载这款旗舰 5G 智能体 AI 芯片的荣耀MagicOS9.0实现了一句话让手机自动操作美团点咖啡。很快商场实体店里便能看到很多品牌手机已经升级为智能体语音助手。下一步#xff0c;这些智能体或许便能…写在前面10月份的时候联发科天玑9400发布搭载这款旗舰 5G 智能体 AI 芯片的荣耀MagicOS9.0实现了一句话让手机自动操作美团点咖啡。很快商场实体店里便能看到很多品牌手机已经升级为智能体语音助手。下一步这些智能体或许便能结合长期交互记忆挖掘表面行为背后的深层模式(例如偏好)。本文整理前段时间调研的智能体基于长期记忆进行反思的几篇论文。 智能体长期记忆与反思 1. 高层抽取--斯坦福虚拟小镇智能体角色模拟基于近期记忆(事件思考)推理高层思考形成反思内容2. 经验积累--Reflexion【NeurIPS 23】: 聚焦多步骤任务基于之前轮次任务执行的反馈分析失败原因将反思出的经验作为长期记忆存储到情景缓冲区用来指导后续轮次的任务决策3. 经验积累-- Ghost in the Minecraft 游戏代理学习成功的规划对应的具体执行步骤4. 终身学习--Jarvis-1开放世界下形成多模态记忆(目标环境成功执行的计划步骤)并基于经验终身学习提升规划能力5. DiLu(的卢)【ICLR 24】记忆初始化模拟人类驾校考试记忆存储llm含有数学计算的推理过程6. MemoChat(腾讯)微调教会智能体识别对话不同主题存储、并检索记忆总结带着目的找论文 1. 高层抽取–斯坦福虚拟小镇智能体角色模拟基于近期记忆(事件思考)推理高层思考形成反思内容 论文Park J S, O’Brien J, Cai C J, et al. Generative agents: Interactive simulacra of human behavior[C]//Proceedings of the 36th annual acm symposium on user interface software and technology. 2023: 1-22. https://dl.acm.org/doi/pdf/10.1145/3586183.3606763腾讯游戏的记忆流还原https://zhuanlan.zhihu.com/p/652160198记忆流截取自demo网站https://reverie.herokuapp.com/replay_persona_state/March20_the_ville_n25_UIST_RUN-step-1-141/2160/Eddy_Lin/ 2. 经验积累–Reflexion【NeurIPS 23】: 聚焦多步骤任务基于之前轮次任务执行的反馈分析失败原因将反思出的经验作为长期记忆存储到情景缓冲区用来指导后续轮次的任务决策 论文Reflexion: Language Agents with Verbal Reinforcement Learning https://arxiv.org/pdf/2303.11366代码https://github.com/noahshinn/reflexion/tree/main吴恩达关于反思的帖子https://zhuanlan.zhihu.com/p/689492556 3. 经验积累-- Ghost in the Minecraft 游戏代理学习成功的规划对应的具体执行步骤 论文https://arxiv.org/pdf/2305.17144 Zhu X, Chen Y, Tian H, et al. Ghost in the minecraft: Generally capable agents for open-world environments via large language models with text-based knowledge and memory[J]. arXiv preprint arXiv:2305.17144, 2023.知乎讲解https://zhuanlan.zhihu.com/p/646912995 4. 终身学习–Jarvis-1开放世界下形成多模态记忆(目标环境成功执行的计划步骤)并基于经验终身学习提升规划能力 论文JARVIS-1: Open-world Multi-task Agents with Memory-Augmented Multimodal Language Models https://ieeexplore.ieee.org/document/10778628作者的视频讲解https://event.baai.ac.cn/live/724新智元解读https://cloud.tencent.com/developer/article/2369853 5. DiLu(的卢)【ICLR 24】记忆初始化模拟人类驾校考试记忆存储llm含有数学计算的推理过程 论文DiLu: A Knowledge-Driven Approach to Autonomous Driving with Large Language Models https://arxiv.org/abs/2309.16292代码https://github.com/PJLab-ADG/DiLu上海AI Lab发布首个模仿人类学习范式的自动驾驶决策框架DiLu https://www.51cto.com/article/780271.html 6. MemoChat(腾讯)微调教会智能体识别对话不同主题存储、并检索记忆 论文hMemoChat: Tuning LLMs to Use Memos for Consistent Long-Range Open-Domain Conversation https://arxiv.org/abs/2308.08239代码https://github.com/LuJunru/MemoChat 总结
带着目的找论文
关注发表时间、单位、期刊、是否有落地/代码阅读摘要和简介里贡献粗略了解要解决的问题、提出的方法、达到的结果→判断是否符合当前需求、是否继续阅读 不符合则暂时中止符合则详细了解设计的方法有什么可借鉴之处、实验部分如何评估并带来多大的增益论文解释不清楚的地方必要可寻找补充材料和代码(如prompt如何定义反思的概念) 最后整体思考和总结优点、缺点再次思考可借鉴的地方。整体扫描结束后回头整理所有看的论文输出结论。