
Computer Vision: Cognitive Models for Visual Commonsense
《计算机视觉:视觉常识的认知模型》
作者: Yixin Zhu (Author), Song-Chun Zhu (Author)
出版社:Springer
出版时间:2026年1月1日
这本关于视觉常识推理的著作是三卷本系列丛书的第一卷,它提出了一个计算框架,旨在弥合现代计算机视觉能力与类人视觉理解之间的差距。尽管当前的人工智能系统在模式识别任务中表现出色,但它们往往缺乏人类在理解和与环境互动时所展现的那种复杂推理能力。本书通过将物理推理、社会推理和抽象推理整合到一个统一的计算框架中,解决了这一局限性。
本书分为三个部分。第一部分通过系统地考察物理理解,包括可供性、直觉物理、因果关系和工具使用,建立了视觉常识的理论基础。这些要素构成了理解物体和环境如何运作和互动的基础。第二部分深入探讨了社会推理方面,探索了意图、心智理论和非语言交流——这些都是人工智能系统解释和预测人类行为的关键能力。第三部分研究了抽象视觉推理,考察了更高层次的认知能力。
本书融合认知科学、计算机视觉和人工智能,主要内容包括:
系统阐述视觉常识,涵盖从基础理论到实际应用的各个方面
介绍整合多种推理形式的计算框架
通过大量实例和案例研究展示其应用
重点阐述类人视觉人工智能发展面临的挑战和未来方向
电子版代找请联系:yefei147852
电子版代找请联系:yefei147852

未经允许不得转载:我的生活分享 » 《Computer Vision: Cognitive Models for Visual Commonsense》PDF+mobi+epub高清完整电子版

《Unproven, Unlikely, and Firmly Believed: Why We Fall for History’s Most Seductive Conspiracy Theories, and How We Rediscover Reality》PDF+mobi+epub高清完整电子版
《Vision Language Models: Building VLMs with Hugging Face》PDF+mobi+epub高清完整电子版
《The Infinite Alphabet: And the Laws of Knowledge》PDF+mobi+epub高清完整电子版
《Soulful Living: Becoming Truly Human Across the Myths of AI》PDF+mobi+epub高清完整电子版
《The Scythians: Lost Civilizations 》PDF+mobi+epub高清完整电子版
《Future Skills: The 20 Skills and Competencies Everyone Needs to Succeed in a Digital World》PDF+mobi+epub高清完整电子版
《In Search of Trade and Fortune: John Cabot, Christopher Columbus and the Opening of the Atlantic》PDF+mobi+epub高清完整电子版
《The Power of Authenticity: Find Your Own Superpowers, Purpose, and Path to Success》PDF+mobi+epub高清完整电子版
《打開錢意識:化解金錢焦慮,實踐富足心態,讓錢進得來、留得住、花得安心》PDF+mobi+epub高清完整电子版
《Leave the Lights On: How Joyful Decisions Can Save Our Species》PDF+mobi+epub高清完整电子版