近日,清华大学建筑学院王毅教授团队在国际建筑科学领域核心学术刊物《Automation in Construction》,发表题为《Machine Intelligence for Interpretation and Preservation of Built Heritage》(基于机器智能的建成遗产的解析与保护)的研究论文。
该论文系统梳理了建成遗产保护领域中采用的主流机器学习模型及其应用场景,在分析既有应用模式不足之后,提出通过多模态机器学习模型,解析建成遗产复合尺度特征的理想应用路径。
近年来随着数字化技术的发展,通过数字化工具描述和解析建成遗产的文化信息和保护价值,成为建筑学和遗产保护界关注的焦点。然而,由于既有数字化手段在处理多视角、大信息量的建成遗产图像(如照片、卫星影像、航拍影像、三维点云)时,往往难以全面准确提取其在复合尺度的综合特征,因此,多模态机器学习模型因其强大的数据处理能力和自主迭代的特征提取能力,被引入建成遗产的保护研究中。
该文核心综述包含两部分。第一部分的综述文献基于计算机或统计学领域的顶级国际会议,包括但不限于CVPR、ICLR、ACL、ICCV、NeurIPS、AAAI、CACML,以及相关的开创性书籍,系统总结了经典和先进的机器学习模型,并剖析其迭代优化网络的具体反馈机制;第二部分的综述文献基于建筑学和遗产保护领域的同行评议论文,搜索的文献平台包括但不限于Scopus、Web of science、Google scholar,归纳了相关模型在1)量化形式特征、2)解析地理人文成因、3)制定实践性保护策略,三个场景中的既有应用模式。具体如图1所示。
图1 既有模型的三个应用场景分析
基于以上论述,该文认为建成遗产机器学习的相关研究在1)量化提取建成遗产形式特征、2)将点云作为理想的建成遗产数字载体以及3)形成机器自主决策的建成遗产保护路径三个方面,仍需要改进和提升,并指出在取得上述改进后,可形成如图2所示的理想应用路径。
图2 多模态机器学习模型解析和保护建成遗产的理想应用路径
该研究具有重要的理论和实践意义,其主要贡献在于推动建成遗产保护方法论的进步,为相关领域的研究者提供基于人工智能的视角和框架,使研究者和决策者能够更加规范地应用相关模型,保护和传承建成遗产的核心信息与价值。
论文DOI:https://doi.org/10.1016/j.autcon.2025.106055
全文链接:https://www.sciencedirect.com/science/article/pii/S0926580525000950
团队介绍:清华大学建筑学院长聘教授王毅为该论文的通讯作者和指导教师,博士生祖晓屹为第一作者。近年来王毅教授团队致力于通过机器学习等可量化方法,解析传统村落的多维度特征,并应用于川西北藏羌地区的传统村落的研究和保护。团队近两年的相关论文成果还有:《Towards Religious Landscape: Protection of Tibetan Buddhist Heritage in Aba Prefecture》(迈向宗教景观:阿坝州藏传佛教遗产的保护);《Interpreting Regional Characteristics of Tibetan-Qiang Houses in Northwestern Sichuan by Deep Learning and Image Landscape》(利用深度学习和图像景观解读川西北藏羌民居的地域性特征)(以上两篇发表于《International Journal of Applied Earth Observation and Geoinformation》刊物);《山区地形起伏度与村落空废关系分析——以理县为例》;《Survey of Built Environment in the Era of UAV from Aerial Photogrammetry to Point Cloud Classification》(无人机时代的建成环境调查:从航测摄影到点云分类)等。