{"version":"https://jsonfeed.org/version/1.1","title":"苏迟但到的主页","home_page_url":"https://kexohproject.pages.dev","feed_url":"https://kexohproject.pages.dev/json/","description":"<p>你好，欢迎访问个人主页！</p><p>擅长密码学，安全分析，数字水印等技术。</p><p>你可以联系我通过:findmykexin@gmail.com或者知乎私信。</p><p>我的知乎链接：<a href=\"https://www.zhihu.com/people/su-chi-dan-dao\" rel=\"noopener noreferrer\" target=\"_blank\">苏迟但到 - 知乎 (zhihu.com)</a></p><p>我的github链接：<a href=\"https://github.com/kexinoh\" rel=\"noopener noreferrer\" target=\"_blank\">kexinoh</a></p>","icon":"https://kexohcdn.gptapi.cyou/kexohproject/production/images/channel-2e54d141ee195646ca12a9d16507a908.jpg","favicon":"https://kexohcdn.gptapi.cyou/kexohproject/production/images/favicon-340a2925d02a0386f3b954a032834917.jpg","authors":[{"name":"苏迟但到"}],"language":"zh-cn","items":[{"id":"knq08tNj7Tc","title":"大模型的终局是「通用」还是「专用」？","content_html":"<p data-pid=\"ll3oPmLk\">通用模型。</p><p data-pid=\"_WEyT9mJ\">这是由于知识的本质要求的。</p><p data-pid=\"Z0NfxW2r\">最近我一直在思考图片语义识别的问题。</p><p data-pid=\"585rLeVQ\">其实图片分类的相关研究已经做了10年了，现在做语义识别也正在开始，但是很容易发现多模态的效果比单纯的语义识别好很多。</p><p data-pid=\"a5SZ34vd\">我们可以举一个例子，一个90岁老人拿着樱桃味的可口可乐，吃着麦当劳。我们可以用这些要素中得知他是巴菲特。</p><p data-pid=\"JSmOCps8\">但是单纯的图片识别算法肯定不能获取这部分知识，或者换句话来说如果对任意一张图都可以充分的理解，那么它已经拥有了全面的逻辑能力。</p><p data-pid=\"izTLNuKE\">再说回来图片识别，例如GPT4V就不能识别两把叠起来的椅子，这是因为图片库里面不存在情况，它不能识别8支腿的是啥？</p><p data-pid=\"5xaizA6K\">但是GPT4.5就不一样了，具有了3D模型的相应知识，那么一把倒着的椅子和一把侧着的椅子对于AI的识别难度将会是相等的，它们将会同样映射到一个3D模型，从而3D的模型知识将会反应给语义识别中。</p><p data-pid=\"lDb8a3h-\">多模态的知识能力将会远远超过单一模态能力的上限，从而实现真正意义上的降维打击。</p><p></p>","content_text":"通用模型。\n\n这是由于知识的本质要求的。\n\n最近我一直在思考图片语义识别的问题。\n\n其实图片分类的相关研究已经做了10年了，现在做语义识别也正在开始，但是很容易发现多模态的效果比单纯的语义识别好很多。\n\n我们可以举一个例子，一个90岁老人拿着樱桃味的可口可乐，吃着麦当劳。我们可以用这些要素中得知他是巴菲特。\n\n但是单纯的图片识别算法肯定不能获取这部分知识，或者换句话来说如果对任意一张图都可以充分的理解，那么它已经拥有了全面的逻辑能力。\n\n再说回来图片识别，例如GPT4V就不能识别两把叠起来的椅子，这是因为图片库里面不存在情况，它不能识别8支腿的是啥？\n\n但是GPT4.5就不一样了，具有了3D模型的相应知识，那么一把倒着的椅子和一把侧着的椅子对于AI的识别难度将会是相等的，它们将会同样映射到一个3D模型，从而3D的模型知识将会反应给语义识别中。\n\n多模态的知识能力将会远远超过单一模态能力的上限，从而实现真正意义上的降维打击。\n\n","date_published":"2023-12-24T15:16:58.000Z","_microfeed":{"web_url":"https://kexohproject.pages.dev/i/大模型的终局是「通用」还是「专用」-knq08tNj7Tc/","json_url":"https://kexohproject.pages.dev/i/knq08tNj7Tc/json/","rss_url":"https://kexohproject.pages.dev/i/knq08tNj7Tc/rss/","guid":"knq08tNj7Tc","status":"published","itunes:title":"New Article Title for iTunes","date_published_short":"Sun Dec 24 2023","date_published_ms":1703431018000}}],"_microfeed":{"microfeed_version":"0.1.2","base_url":"https://kexohproject.pages.dev","categories":[{"name":"Education","categories":[{"name":"Language Learning"}]},{"name":"Technology"}],"subscribe_methods":[{"name":"RSS","type":"rss","url":"https://kexohproject.pages.dev/rss/","image":"https://kexohproject.pages.dev/assets/brands/subscribe/rss.png","enabled":true,"editable":false,"id":"4KlfbtkEfzy"},{"name":"JSON","type":"json","url":"https://kexohproject.pages.dev/json/","image":"https://kexohproject.pages.dev/assets/brands/subscribe/json.png","enabled":true,"editable":false,"id":"DVFm7TYiNSq"}],"description_text":"你好，欢迎访问个人主页！\n\n擅长密码学，安全分析，数字水印等技术。\n\n你可以联系我通过:findmykexin@gmail.com或者知乎私信。\n\n我的知乎链接：苏迟但到 - 知乎 (zhihu.com)\n\n我的github链接：kexinoh","copyright":"©2024","itunes:type":"episodic","items_sort_order":"newest_first"}}