{"version":"https://jsonfeed.org/version/1.1","title":"苏迟但到的主页","home_page_url":"https://kexohproject.pages.dev","feed_url":"https://kexohproject.pages.dev/json/","description":"<p>你好，欢迎访问个人主页！</p><p>擅长密码学，安全分析，数字水印等技术。</p><p>你可以联系我通过:findmykexin@gmail.com或者知乎私信。</p><p>我的知乎链接：<a href=\"https://www.zhihu.com/people/su-chi-dan-dao\" rel=\"noopener noreferrer\" target=\"_blank\">苏迟但到 - 知乎 (zhihu.com)</a></p><p>我的github链接：<a href=\"https://github.com/kexinoh\" rel=\"noopener noreferrer\" target=\"_blank\">kexinoh</a></p>","icon":"https://kexohcdn.gptapi.cyou/kexohproject/production/images/channel-2e54d141ee195646ca12a9d16507a908.jpg","favicon":"https://kexohcdn.gptapi.cyou/kexohproject/production/images/favicon-340a2925d02a0386f3b954a032834917.jpg","authors":[{"name":"苏迟但到"}],"language":"zh-cn","items":[{"id":"5W0KZrKY2R1","title":"现在在追一个女生，应该每天和她聊点什么？","content_html":"<p data-pid=\"AjB-jlQ3\">我也很苦恼哦，最近正在看多智能体问题，我来论述一下这个问题的难点吧。在传统的单智能体模型里面只需要训练你一个人就可以了。</p><p data-pid=\"yfqXeNA3\">但是在现实生活中，每一个智能体不能获取全部的信息，只能获取其他智能体或者环境传送过来的信息，并且你传递出去的信息同时会改变对方的状态。就好像你在和女孩子聊天的时候，不能获取她的真实想法，自然你训练的时候精度不会太高。你的奖励函数或者期望函数只能由女生提供的API来决定你今天的聊天的水平，但是这里面干扰太多了。举个例子，今天女生作业压力太大了或者明天早上练车，于是说不聊了。但是你不知道啊，于是你就开始反思你的模型或者说你的话题有没有问题。</p><p data-pid=\"NyM5Df3U\">而多智能体模型是考虑下，考虑的是全局的最优化，对方也参与到这个训练中了，高频度的信息传递和反馈才是使得整个模型的训练成功的根本，也就是说你聊不下了的原因是因为女生也不太想聊了或者说你们的信息反馈机制出现了问题。</p><p data-pid=\"zScwxT-V\">至于如何让女生也参与到模型中的训练来，我表示我也不知道，这是另外一个话题了。</p>","content_text":"我也很苦恼哦，最近正在看多智能体问题，我来论述一下这个问题的难点吧。在传统的单智能体模型里面只需要训练你一个人就可以了。\n\n但是在现实生活中，每一个智能体不能获取全部的信息，只能获取其他智能体或者环境传送过来的信息，并且你传递出去的信息同时会改变对方的状态。就好像你在和女孩子聊天的时候，不能获取她的真实想法，自然你训练的时候精度不会太高。你的奖励函数或者期望函数只能由女生提供的API来决定你今天的聊天的水平，但是这里面干扰太多了。举个例子，今天女生作业压力太大了或者明天早上练车，于是说不聊了。但是你不知道啊，于是你就开始反思你的模型或者说你的话题有没有问题。\n\n而多智能体模型是考虑下，考虑的是全局的最优化，对方也参与到这个训练中了，高频度的信息传递和反馈才是使得整个模型的训练成功的根本，也就是说你聊不下了的原因是因为女生也不太想聊了或者说你们的信息反馈机制出现了问题。\n\n至于如何让女生也参与到模型中的训练来，我表示我也不知道，这是另外一个话题了。","date_published":"2021-07-15T09:04:55.000Z","_microfeed":{"web_url":"https://kexohproject.pages.dev/i/现在在追一个女生-应该每天和她聊点什么-5W0KZrKY2R1/","json_url":"https://kexohproject.pages.dev/i/5W0KZrKY2R1/json/","rss_url":"https://kexohproject.pages.dev/i/5W0KZrKY2R1/rss/","guid":"5W0KZrKY2R1","status":"published","itunes:title":"New Article Title for iTunes","date_published_short":"Thu Jul 15 2021","date_published_ms":1626339895000}}],"_microfeed":{"microfeed_version":"0.1.2","base_url":"https://kexohproject.pages.dev","categories":[{"name":"Education","categories":[{"name":"Language Learning"}]},{"name":"Technology"}],"subscribe_methods":[{"name":"RSS","type":"rss","url":"https://kexohproject.pages.dev/rss/","image":"https://kexohproject.pages.dev/assets/brands/subscribe/rss.png","enabled":true,"editable":false,"id":"4KlfbtkEfzy"},{"name":"JSON","type":"json","url":"https://kexohproject.pages.dev/json/","image":"https://kexohproject.pages.dev/assets/brands/subscribe/json.png","enabled":true,"editable":false,"id":"DVFm7TYiNSq"}],"description_text":"你好，欢迎访问个人主页！\n\n擅长密码学，安全分析，数字水印等技术。\n\n你可以联系我通过:findmykexin@gmail.com或者知乎私信。\n\n我的知乎链接：苏迟但到 - 知乎 (zhihu.com)\n\n我的github链接：kexinoh","copyright":"©2024","itunes:type":"episodic","items_sort_order":"newest_first"}}