<?xml version='1.0' encoding='UTF-8'?>
<?xml-stylesheet href="/rss/stylesheet/" type="text/xsl"?>
<rss xmlns:content='http://purl.org/rss/1.0/modules/content/' xmlns:taxo='http://purl.org/rss/1.0/modules/taxonomy/' xmlns:rdf='http://www.w3.org/1999/02/22-rdf-syntax-ns#' xmlns:itunes='http://www.itunes.com/dtds/podcast-1.0.dtd' xmlns:googleplay="http://www.google.com/schemas/play-podcasts/1.0" xmlns:dc='http://purl.org/dc/elements/1.1/' xmlns:atom='http://www.w3.org/2005/Atom' xmlns:podbridge='http://www.podbridge.com/podbridge-ad.dtd' version='2.0'>
<channel>
  <title>苏迟但到的主页</title>
  <language>zh-cn</language>
  <generator>microfeed.org</generator>
  <itunes:type>episodic</itunes:type>
  <itunes:explicit>false</itunes:explicit>
  <atom:link rel="self" href="https://kexohproject.pages.dev/rss/" type="application/rss+xml"/>
  <link>https://kexohproject.pages.dev</link>
  <description>
    <![CDATA[<p>你好，欢迎访问个人主页！</p><p>擅长密码学，安全分析，数字水印等技术。</p><p>你可以联系我通过:findmykexin@gmail.com或者知乎私信。</p><p>我的知乎链接：<a href="https://www.zhihu.com/people/su-chi-dan-dao" rel="noopener noreferrer" target="_blank">苏迟但到 - 知乎 (zhihu.com)</a></p><p>我的github链接：<a href="https://github.com/kexinoh" rel="noopener noreferrer" target="_blank">kexinoh</a></p>]]>
  </description>
  <itunes:author>苏迟但到</itunes:author>
  <itunes:image href="https://kexohcdn.gptapi.cyou/kexohproject/production/images/channel-2e54d141ee195646ca12a9d16507a908.jpg"/>
  <image>
    <title>苏迟但到的主页</title>
    <url>https://kexohcdn.gptapi.cyou/kexohproject/production/images/channel-2e54d141ee195646ca12a9d16507a908.jpg</url>
    <link>https://kexohproject.pages.dev</link>
  </image>
  <copyright>©2024</copyright>
  <itunes:category text="Education">
    <itunes:category text="Language Learning"/>
  </itunes:category>
  <itunes:category text="Technology"/>
  <item>
    <title>大模型的终局是「通用」还是「专用」？</title>
    <guid>knq08tNj7Tc</guid>
    <pubDate>Sun, 24 Dec 2023 15:16:58 GMT</pubDate>
    <itunes:explicit>false</itunes:explicit>
    <description>
      <![CDATA[<p data-pid="ll3oPmLk">通用模型。</p><p data-pid="_WEyT9mJ">这是由于知识的本质要求的。</p><p data-pid="Z0NfxW2r">最近我一直在思考图片语义识别的问题。</p><p data-pid="585rLeVQ">其实图片分类的相关研究已经做了10年了，现在做语义识别也正在开始，但是很容易发现多模态的效果比单纯的语义识别好很多。</p><p data-pid="a5SZ34vd">我们可以举一个例子，一个90岁老人拿着樱桃味的可口可乐，吃着麦当劳。我们可以用这些要素中得知他是巴菲特。</p><p data-pid="JSmOCps8">但是单纯的图片识别算法肯定不能获取这部分知识，或者换句话来说如果对任意一张图都可以充分的理解，那么它已经拥有了全面的逻辑能力。</p><p data-pid="izTLNuKE">再说回来图片识别，例如GPT4V就不能识别两把叠起来的椅子，这是因为图片库里面不存在情况，它不能识别8支腿的是啥？</p><p data-pid="5xaizA6K">但是GPT4.5就不一样了，具有了3D模型的相应知识，那么一把倒着的椅子和一把侧着的椅子对于AI的识别难度将会是相等的，它们将会同样映射到一个3D模型，从而3D的模型知识将会反应给语义识别中。</p><p data-pid="lDb8a3h-">多模态的知识能力将会远远超过单一模态能力的上限，从而实现真正意义上的降维打击。</p><p></p>]]>
    </description>
    <itunes:title>New Article Title for iTunes</itunes:title>
  </item>
</channel>
</rss>