24小时热门版块排行榜    

CyRhmU.jpeg
查看: 193  |  回复: 0

hfghb

新虫 (初入文坛)

[交流] 【第十五届粤港澳图象图形学术会议】

会议简介
  
       第十五届粤港澳图象图形学术会议将于2025年12月13日-14日在华南理工大学大学城校区举办。本届会议由广东省图象图形学会主办,华南理工大学软件学院、华南理工大学电子与信息学院、CSIG广州会员活动中心承办,琶洲实验室、CSIG生物特征识别专业委员会(筹)协办。
      粤港澳图象图形学术会议(Guangdong-Hong Kong-Macao Conference on Image and Graphics, GHMIG)是由广东省图象图形学会主办,粤港澳三地图象图形学界共同协办的系列学术盛会,致力于推动粤港澳大湾区在图象图形领域的学科发展、技术交流与协同创新。会议汇聚全国高校、科研院所及产业界的专家学者与青年学生,聚焦计算机视觉、计算机图形学、多媒体技术、机器学习等前沿方向,开展深入的学术研讨与技术对话。通过特邀报告、技术交流与海报展示等多种形式,搭建学术界与产业界之间知识共享、成果转化与协同创新的重要平台,持续助力粤港澳大湾区图象图形科技创新生态的建设与发展。
      会议邀请到多位知名专家做大会主旨报告,期待与您共享图象图形识别与计算机视觉学术盛宴(会议同时举办年度图象图形优秀论文分享报告会)。会议期间将召开广东省图象图形学会2025理事工作会议。

会议官方网址:https://conf.gdsig.cn/

会议时间:2025年12月13日-14日

会议地点:广东省广州市华南理工大学(大学城校区)B13会议厅

                                                                                   主旨报告

                                                                             主旨报告:吴国宝

                                                                             香港浸会大学教授

        报告题目:Blind Deconvolution for Color Images Using Normalized Quaternion Kernels   

        报告摘要:Abstract: In this talk, we discuss color image processing by using quaternion algebras. In particular, we study blind deconvolution for color images. Experimental results are presented to demonstrate the effectiveness of quaternion models.

        讲者简介:Department of Mathematics, Hong Kong Baptist University, Hong Kong, China
Michael K. Ng (Senior Member, IEEE) received the BSc and MPhil degrees from the University of Hong Kong in 1990 and 1992, respectively, and the PhD degree from the Chinese University of Hong Kong in 1995. He was a research fellow of Computer Sciences Laboratory with Australian National University from 1995 to 1997, and an assistant/associate professor of the University of Hong Kong from 1997 to 2005. He was a professor/chair professor with the Department of Mathematics, Hong Kong Baptist University from 2006 to 2019. He was a chair professor with Research Division of Mathematical and Statistical Science, The University of Hong Kong from 2019 to 2023. He is currently a chair professor in Mathematics and a chair professor in Data Science with Hong Kong Baptist University. His research interests include bioinformatics, image processing, scientific computing, and data mining. He is selected for the 2017 Class of Fellows of the Society for Industrial and Applied Mathematics. He obtained the Feng Kang Prize for his significant contributions in scientific computing. He serves on the Editorial Board members of several international journals.



                                                                                  主旨报告:林倞

                                                                                  中山大学教授

         报告题目:物理空间智能若干进展:框架、模型与基准

        报告摘要:本报告围绕动态真实物理智能的“框架—模型—基准”三个方面展开。
在框架层面,我们提出 Tweedie 离散扩散模型,实用于语言生成和VLA,并在此基础上构建了 VLA 的 E0 模型。该模型在多项机器人操控数据集及真实机器人实验中均取得领先表现。同时,我们提出的线性算子模型在多项语言任务中展现出高效性与较强表达能力,性能优于主流线性注意力方法。

在模型层面,我们从“通用物理建模”与“空间自适应建模”两个维度重新理解 VLA 模型,发现其泛化性远比普遍认知中更强。仅需约 4k 参数的空间自适应,即可赋予 VLA 模型跨任务的通用能力,这与人类的通用操作能力具有高度一致性。此外,我们提出的物理自回归模型在物理推理、时空预测与动作生成任务中表现出显著强泛化能力,拓展物理推理能力。

在基准层面,我们构建了一个面向动态真实物理环境的全自动、可持续运行的 24/7 真机评测平台,实现了从任务布置、操控执行到结果评估的全流程无人化运作,为未来的真实物理智能研究提供了标准化、可量化、可持续的评测体系。

        讲者简介:林倞,中山大学计算机学院二级教授、国家杰青、IEEE/IAPR/IET Fellow、CCF-ACM青年科技奖获得者、兼任鹏城实验室具身智能研究所所长、曾任商汤科技首席研发总监/研究院执行院长。他长期从事多模态人工智能、大规模机器学习等领域的应用基础研究。作为项目负责人,承担国家自然科学基金重点项目和国家2030科技创新重大项目;曾带领商汤科技研发团队搭建大规模AI基础设施,开拓新兴行业。在国际顶级学术期刊和会议发表论文300余篇,论文被引用4.4万次(谷歌学术统计),多次入选全球高被引学者榜单;获权威期刊Pattern Recognition年度最佳论文奖,多媒体计算旗舰会议ICME最佳论文钻石奖,计算机视觉旗舰会议ICCV最佳论文奖提名,ACL 2025杰出论文奖;指导博士生获得CCF优秀博士论文奖、ACMChina优秀博士论文奖及CAAI优秀博士论文奖;带领团队获得广东省科技进步一等奖、吴文俊人工智能自然科学奖、中国图象图形学学会科学技术一等奖等荣誉。


                                                                                  主旨报告:叶齐祥

                                                                              中国科学院大学特聘教授

        报告题目:从视觉表征模型设计到视觉智能体构建

        报告摘要:研究了局部卷积运算与全局注意力运算的互补性,将局部特征与全局特征耦合形成Conformer网络结构,显著增强小参数视觉模型表征能力。探讨了局部卷积运算造成的自监督学习信息泄露问题,提出了Token Merging操作,突破卷积或局部运算的局部约束,形成高效分层Transformer 表征(HiViT)与全预训练的Transformer 金字塔网络(iTPN)。探索了物理启发的热传导算子vheat与状态空间表征算子vMamba,实现了更高效的视觉表征。在ImageNet分类任务上,iTPN-Base, iTPN-Large, iTPN-Huge 分别达到了88.0%,89.2%, 89.7%的Top-1分类精度。视觉表征模型设计的基础上,开始探索如何构建视觉思维链与视觉智能体。代码:github.com/pengzhiliang/Conformer, github.com/sunsmarterjie/iTPN, github.com/MzeroMiko/VMamba, Vheat.


        讲者简介:叶齐祥,中国科学院大学特聘教授、国家杰出青年基金获得者、中科院卢嘉锡青年人才奖获得者、中国科学院优秀博士生导师、CVPR2023、NeurIPS2023-25、ICLR2024-25 领域主席、国际期刊IEEE TITS,IEEE TCSVT编委。主要进行视觉表征模型、成像与目标感知方向的研究,在CVPR, ICCV, NeurIPS等国际会议与TPAMI, TNNLS, TIP等期刊发表论文150余篇,学术引用20000余次。主持了国家自然科学基金重点项目、原创项目、华为公司、国防科技创新特区项目、中国运载火箭技术研究院课题等国家级与企业科研任务,是国家自然科学基金创新团队、中国科学院稳定支持基础研究领域青年团队成员。开发的视觉表征与感知技术卫星在轨运行,获中国电子学会自然科学一等奖(排名1)、国家技术发明二等奖(排名2),指导多名博士生获中科院院长奖、博士后创新人才计划、中科院百篇优秀博士论文。



                                                                                  主旨报告:张兆翔

                                                                            中国科学院自动化研究所研究员

        报告题目:论世界模型与规模定律

        报告摘要:规模定律被视为近年来人工智能快速跃迁的核心驱动力之一,从根本上塑造了人工智能技术发展的方向与范式。与此同时,世界模型作为人工智能领域的新兴热点,在近期受到了极为广泛的关注,正展现出通向通用智能的巨大潜力,被认为是下一代人工智能技术的可行之路。本报告立足当前研究进展,对这两大概念进行系统梳理与前瞻性分析,并重点探讨二者之间的相互作用:是规模定律继续为世界模型的发展保驾护航,还是世界模型为规模定律注入新的生命力?报告将结合团队近期的研究探索,对这一命题展开讨论与思考。

        讲者简介:张兆翔,中国科学院自动化研究所研究员、博士生导师,模式识别实验室常务副主任,中国科学院大学岗位教授,国际模式识别学会会士、亚太人工智能学会会士,“教育部长江学者特聘教授”。研究方向是模式识别、具身智能、智能体学习。先后主持了国家自然科学基金重点项目、联合基金重点、重点国际(地区)合作研究、北京市重点研发计划、中科院先导科技专项、启元国家实验室重点项目、装备部重点项目等多项国家级重点项目,在IEEE T-PAMI、CVPR等本领域国际主流期刊与会议发表论文200余篇,授权发明专利35项。是TPAMI、IJCV、PR等人工智能顶刊编委,ICCV、CVPR、NeurIPS等人工智能顶会领域主席,获北京市科技进步奖一等奖(排名第一)、北京市科技奖杰出青年中关村奖、中国电子学会科技进步一等奖等。


                                                                                  主旨报告:戴玉超

                                                                                     西北工业大学

        报告题目:论世界模型与规模定律

        报告摘要:事件相机(Event Camera)作为新型仿生视觉传感器,异步响应像素级亮度变化,突破了传统帧式相机在高速运动、高动态范围场景中的局限。事件相机在自动驾驶、机器人导航、军事国防、深空探测、高速工业检测等领域展现出巨大潜力。报告围绕课题组在基于事件相机的运动感知与生成方面的工作展开,涵盖二维与三维运动估计、长时点轨迹跟踪、运动物体跟踪与分割、视频帧生成、新视角生成等子任务,以打破现有基于帧的图像相机存在的感知瓶颈,展现事件相机在复杂动态场景下的感知与生成潜力。

        讲者简介:戴玉超,西北工业大学电子信息学院教授、博士生导师,校学术委员会委员,陕西省信息获取与处理重点实验室主任。研究方向为机器视觉与人工智能,主持国家自然科学基金青年科学基金A类项目(原国家杰青)、JKW基础加强计划领域基金重点等项目。近年来在TPAMI、IJCV、ICCV、CVPR、NeurIPS等国际著名期刊和会议上发表论文80余篇,谷歌学术引用超过16000次,H因子59。获CVPR 最佳论文奖、陕西省自然科学奖一等奖、CSIG青年科学家奖等奖项。担任国际顶刊TPAMI编委、IJCV编委、APSIPA杰出讲者、China3DV 2025大会主席、中国空间智能大会程序主席和CVPR、ICCV、ECCV、NeurIPS等国际会议领域主席。

                                                                                  主旨报告:钱建军

                                                                                      南京理工大学


        报告题目:人脸感知:由外至内

       报告摘要:人脸是最富社会信息的“视觉语言”。自古至今,人类都在试图透过人脸外在表象理解内在状态。当前,视觉人脸感知及交互生成是智能体实现健康监测、情感引导等任务的基础。报告将围绕课题组近期在人脸感知与生成方面的工作展开,包括生理信息感知(体温、心率和呼吸率)、多模态情感分析与数字人像生成等内容,并进一步探讨相关任务的共性问题和发展趋势。

       讲者简介:南京理工大学教授、博士生导师,中国人工智能学会模式识别专委会副秘书长、江苏省人工智能学会模式识别专委会副主任。研究方向为模式识别与视觉计算、以人为中心的具身感知,相关成果发表在IEEE TPAMI/TIP/TNNLS, IJCV, PR, CVPR/AAAI/ACMMM等国际权威刊物和知名国际会议100余篇。先后主持国家自然科学基金项目3项、江苏省基础研究计划重点项目1项,参与JW科技委基础加强项目等多项。获得江苏省科学技术奖一等奖2项(分别为第二、四完成人)。入选国家级青年人才计划、“香江学者计划”、江苏省“青蓝工程”优秀青年骨干教师等。指导学生在“Udacity - DiDi无人驾驶全球挑战赛”、“ChinaMM-用户兴趣建模大赛”、“IJCAI-基于视觉的远程生理信号感知竞赛”等多项赛事中获得冠/亚军。


                                                                                  主旨报告:刘贤明
                                                                                      哈尔滨工业大学


       报告题目:先进三维视觉感知

       报告摘要:从传感器数据中恢复、推断并理解环境中物体或场景的三维几何结构、空间关系及其运动信息,是具身智能、虚拟/增强现实(VR/AR)、自动驾驶等领域的重要基础问题。物体的在线 6D 位姿感知与深度估计,构成了具身智能中的两项核心技术环节。本报告将介绍课题组在该方向的最新研究进展,涵盖单目视频下的零样本物体 6D 位姿跟踪、基于隐式表面优化的 6D 位姿修正,以及多传感器协同深度估计等关键技术。

        讲者简介:刘贤明,现任哈工大计算机学院长聘教授、副院长,国家自然科学青年科学基金A类(原国家杰青)和B类(原国家优青)获得者。研究方向为可信机器学习、多媒体信息处理,在Nature Methods、Nature Communications、TPAMI、JMLR、TRO、NeurIPS、ICML、ICLR、CVPR、ICCV、ECCV等国际顶级期刊和会议上发表论文200余篇。获得中国图象图形学学会自然科学奖、黑龙江省青年科技奖、中国人工智能学会第八届吴文俊人工智能优秀青年奖,IEEE多媒体领域旗舰会议ICME2016最佳学生论文奖和Springer IFTC2016最佳论文奖。主持国家重点研发计划重点专项项目、课题,国家自然科学青A、优青、重大研究计划、面上和青年等项目。指导的博士生获评中国人工智能学会优秀博士论文奖、首届黑龙江人工智能学会优秀博士论文一等奖(唯一获奖者)、首批国家自然科学基金青年学生基础研究项目资助。荣获哈工大“育人新星”青年导师荣誉称号和黑龙江省研究生教学成果奖特等奖(第二完成人)。


                                                                                  主旨报告:韩欣彤

                                                                                  腾讯公司

       报告题目:混元3D研发布局与应用

       报告摘要:本次演讲将聚焦混元3D生成技术,通过 “3D物体生成” 和 “3D世界生成” 两大核心方向,系统拆解其研发的技术布局和核心突破,以及在多元行业场景中的落地应用与实践成果。

       讲者简介:韩欣彤,美国马里兰大学帕克分校博士。长期深耕计算机视觉、深度学习与 AI 大模型领域,发表相关论文 50 余篇,累计引用超 9000 次。现任腾讯混元 3D 生成中心研究员,专注 3D 物体生成算法的研究与落地,主导算法及项目已应用于腾讯多款头部游戏,并通过腾讯云服务赋能超 100 家外部客户。


                                                                                  主旨报告:林铖

                                                                                     澳门科技大学


       报告题目:AIGC时代的游戏数字内容生成

       报告摘要:生成式人工智能(AIGC)的突破式发展对全球范围内各行各业产生了革命性的影响。数字内容与互动游戏领域,由于其对个性化体验、内容丰富度以及沉浸互动性等较高要求,成为AIGC新技术加速应用的核心场景。在这一背景下,本报告探讨了AIGC技术在重塑游戏数字内容生产范式方面的研究,重点分析如何运用生成式AI技术赋能关键内容制作环节,包括原画创作、3D模型生成、PBR材质贴图、角色建模、模型几何处理与重拓扑等。在现有制作管线之外,本报告对基于可控视频创作的未来数字内容管线技术进行了探索,并对未来游戏AIGC技术进行了展望。

       讲者简介:林铖,澳门科技大学计算机科学与工程学院助理教授,研究方向为三维视觉、计算机图形学、人机交互和数字文娱等。他于2021在香港大学计算机系获得博士学位,于2019年在德国慕尼黑工业大学访问研究。他在2021至2025年间在分别米哈游、腾讯互娱的研究部门担任高级研究员、AI Graphics方向负责人,入选腾讯技术大咖头部人才计划。他还是3D生成AI研究社区AnySyn3D的创始人和组织者之一。近年来,他在业界头部游戏企业主导了多个游戏3D资产AI生成项目的落地研发。他获得了5项国家及国际发明专利授权。他在CVPR, ICCV, NeurIPS, ICLR, SIGGRAPH, TPAMI等计算机视觉和图形学的顶级会议和期刊上发表了三十余篇论文,Google学术引用近3000次。他以第一作者身份获得CVPR2021最佳论文候选,以第一作者、通讯作者身份进入ICLR2024和CVPR2024最具影响力论文名单。


                                                                                  主旨报告:李弘扬

                                                                                        香港大学


       报告题目:Towards Generalizable and Intelligent System for Robotic Manipulation

       报告摘要:Hongyang Li is an Assistant Professor at The University of Hong Kong and has led OpenDriveLab (opendrivelab.com) since 2021. His research focus is on autonomous driving and embodied AI. He led the end-to-end autonomous driving project, UniAD and won the IEEE CVPR 2023 Best Paper Award. He created the first large-scale real robot ecosystem, Agibot World, that systematically investigated the scaling law principles for robotic manipulation. He served as Area Chair for CVPR, NeurIPS, ICLR, ICCV, ICML, RSS.

讲者简介:A generalist robot should perform effectively across various environments. However, most existing approaches heavily rely on scaling action-annotated data to enhance their capabilities. Consequently, they are often limited to single physical specification and struggle to learn transferable knowledge across different embodiments and environments. To confront these limitations, we propose UniVLA, a new framework for learning cross-embodiment vision-language-action (VLA) policies. Our key innovation is to derive task-centric action representations from videos with a latent action model. This enables us to exploit extensive data across a wide spectrum of embodiments and perspectives. To mitigate the effect of task-irrelevant dynamics, we incorporate language instructions and establish a latent action model within the DINO feature space. Learned from internet-scale videos, the generalist policy can be deployed to various robots through efficient latent action decoding. We obtain state-of-the-art results across multiple manipulation and navigation benchmarks, as well as real-robot deployments. UniVLA achieves superior performance over OpenVLA with less than 1/20 of pretraining compute and 1/10 of downstream data. Continuous performance improvements are observed as heterogeneous data, even including human videos, are incorporated into the training pipeline. The results underscore UniVLA's potential to facilitate scalable and efficient robot policy learning.

                                                                                       墙报(Poster)

                                                                              墙报(Poster)征集报名截止时间

                                                                                     2025年11月30日

                                                                                优秀论文入选反馈时间

                                                                                    2025年12月10日

                                                                                  优秀论文评选方法

优秀论文的评选以Poster形式提交并开展,具体举措为:

1.将论文划分为3个方向: a)计算机视觉, b)机器学习, c)多模态分析

2.根据所提交Poster按方向由评委会组织评选优秀论文,获奖证书由广东省图象图形学会认证颁发。

3.参与评奖的文章接收时第—作者须为在校学生。

4.为避免重复获奖,已获得其他相关国际国内学术会议或协会奖项的文章不予参评优秀论文,将被列为Spotlight Paper。

现开始征集2025第十五届粤港澳图象图形学术会议墙报(Poster),征集范围限定为2024年以来发表/录用的顶会顶刊论文(需电子数据库可查),建议期刊和会议列表如下:

·期刊:Nature及子刊、IEEE TPAMI, IJCV, JMLR, IEEE TIP, IEEE TNNLS, IEEE TCSVT, IEEE TMM, ACM TOG, IEEE TVCG, IEEE TMI, IEEE TGRS等

·会议:CVPR, ICCV, NeurIPS, ICML, ECCV, AAAI, IJCAI, ICLR, ACMMM, SIGGRAPH, SIGGRAPH Asia, MICCAI等


                                                                                  报名方式及联系方式

如您有意展示您的最新科研进展并参与评奖,请于2025年11月30日前在线填写报名表单,并根据官网提供的Poster格式与样例进行制作,连同论文一起发送至lnn0200@163.com(邮件命名:墙报评选+单位+第一作者), 组委会将于12月10日前邮件反馈入选信息,入选的Poster必须完成会议注册。

报名链接:https://docs.qq.com/form/page/DWWF2ekxGZmppT0RG

官网链接查看Poster格式规定与样例

征文模板链接:https://docs.qq.com/slide/DWXBmVVNJT01vS251

联系方式

联系人:崔金荣、刘琦、胡建芳

联系邮箱:lnn0200@163.com(邮件命名:墙报评选+单位+第一作者)


                                                                                  会议注册


网页端通过链接注册:

        https://wj.qq.com/s2/24621614/a0ed/

3.缴费方式

1. 微信、支付宝、或线下转账汇款方式(具体见注册时引导内容)。

2. 付款时请务必附言备注:姓名+单位。

3. 缴费后需上传付款凭证截图。

4.发票开具

会议发票由会务公司:广州衡粤文化传播有限公司开具

5.联系方式

注册缴费以及发票相关:彭琪13622760510(微信同号)


                                                                                  主办单位

                                                                           广东省图象图形学会

                                                                                  承办单位
                                                                   华南理工大学软件学院、电子与信息学院

                                                                                  联合承办单位

                                                                          CSIG广州会员活动中心

                                                                                  协办单位

                                                                                 琶洲实验室

                                                                     CSIG生物特征识别专业委员会(筹)

【第十五届粤港澳图象图形学术会议】
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 hfghb 的主题更新
普通表情 高级回复(可上传附件)
信息提示
请填处理意见