1066vip威尼斯下载-DownLoad

陶大鹏

教授

  • 教授,博导(计算机科学与技术)
  • 联系方式:917888366@qq.com
  • 地址:信息学院3304

个人简介

陶大鹏,1066vip威尼斯下载教授,云岭学者IET Fellow,爱思唯尔中国高被引学者,中国科学院大学博导,西北工业大学客座研究员,中国科学院深圳先进技术研究院客座研究员,中国计算机学会计算机视觉专委会执行委员,中国认知科学学会认知与类脑专委会委员。现任国际刊物IEEE Internet of Things (JCR1)IEEE TETCI (JCR1) 以及国内期刊《应用科技》编委,担任IEEE T-PAMIT-NNLST-IPT-CYBT-MMT-CSVT等十多家国际学术期刊的特约审稿人和客座编辑。

目前主要从事人工智能领域的研究工作,合作单位包括:中科院深圳先进技术研究院、中科院自动化所、西北工业大学、上海交通大学、武汉大学、悉尼大学、腾讯AI Lab、华为、上海人工智能国家实验室等研究机构,累计发表SCI检索源刊和顶会100余篇,研究成果获得国际论文奖2项。主持包括国家自然科学基金面上项目、云南省重大专项计划项目、云岭学者专项项目等在内的科研项目10余项,获省部级奖励10项,2023年荣获1066vip威尼斯下载第二十届教学成果特等奖。

研究方向

机器学习:可解释的深度学习、大模型预训练

计算机视觉:目标检测、目标跟踪、图像生成

诊疗大数据:临床数据挖掘、医疗影像分析

机器人:系统设计、结构设计

学科竞赛

    全国大学生机器人大赛RoboMaster是由共青团中央、全国学联、深圳市人民政府联合主办的赛事,作为教育部认定的重要学科竞赛,得到了国内外知名高校的广泛关注。FIST实验室在1066vip威尼斯下载信息学院支持下筹备并建设了1066vip威尼斯下载Future机器人战队,现已形成了以研究生为领队,高年级本科生为主干力量,低年级本科生为后备人才的学科竞赛团体。迄今为止,战队已代表1066vip威尼斯下载参加RM2018RM2019RM 2020三届赛事,累计荣获国家级、省级竞赛奖励150余项。

成果转化

    面向工业制造柔性分拣需求,研究团队结合图像检测、定位和姿态估计等技术设计了一套智能视觉分拣抓取系统。该系统实现了工业级快速抓取微小零件的能力。目前,研究成果已成功应用于深圳优必选科技股份有限公司积木零件分拣生产线。

科研情况

1. 近三年代表性科研项目

(1)复杂场景图像处理和行业知识图谱关键技术研究及创新应用,云南省科技重大专项,2022.01-2024.12。

项目主要联合昆明理工大学、云南腾云信息产业有限公司等单位,对“数字云南”实施计划中的数字治理、智慧应急、智慧旅游等云南省重点发展领域,开展具有行业针对性的图像、视频、自然语言等数据处理理论研究以及关键技术实现应用,并进一步在旅游监管、公共应急管理和互联网舆情分析三个行业开展应用领域落地。

(2)室外巡检机器人中的视觉检测关键技术研究,国家自然科学基金面上项目,2022.01-2025.12。

项目针对巡检机器人在室外开展视觉识别及感知任务过程中面临的成像质量低、巡检任务多样化、模型泛化能力不足以及图像标注困难等问题,开展低质图像复原、小样本目标检测、弱监督细粒度分类等研究,以支撑机器人实现智能化、数字化巡检。

(3)医疗大模型关键技术研究及创新应用

合作单位:华为技术有限公司、云南云上云大数据产业开发投资有限公司

依托华为昇腾Atlas算力集群以及MindSpore AI框架(不低于20P算力,100T存储),共同开展以医疗信息化模型为核心的通用人工智能预训练技术,实现面向医疗领域的自然语言和视觉多模态数据处理关键技术突破,构建千亿级参数规模的医疗信息化模型,探索并发展大模型预训练技术在医疗信息化领域中的应用服务。

(4)面向广告OCR的行业预训练模型构建及相关落地应用研究

合作单位:深圳市腾讯计算机系统有限公司

项目主要联合腾讯AI LAB,围绕腾讯广告多媒体AI中心积累的海量广告图像及视频数据,开展基于自监督学习的广告OCR行业预训练模型构建和生成式语言模型稀疏化研究,解决视频广告中的字幕识别和背景文字识别等行业应用难题。


2.  科研获奖

[1]    局部结构保持及特征表示理论与方法,中国自动化学会奖(自然科学二等奖,2022年)

[2]    基于多传感器的人体动作识别研究,云南省科学技术奖(自然科学二等奖,2021年)

[3]    图像分析与检索基础理论研究,教育部高等学校科学研究优秀成果奖(自然科学奖二等奖,2018年)

[4]    智慧银行设备安全可控关键技术及应用,广东省科学技术奖(科技进步奖二等奖,2017年)

[5]    异构可视媒体的内容分析与可信服务研究,陕西省科学技术奖(自然科学奖一等奖,2016年)

[6]    智能互联网机器人,吴文俊人工智能科学技术奖(进步奖二等奖,2014年)

教学情况

1.指导学生论文发表

指导硕士、博士研究生在IEEE TIPTMMTCSVTICCVCVPR等人工智能领域国际期刊/会议上发表学生一作论文30多篇,指导学生获得IEEE RCARICME最佳学生论文奖2项。

2.指导学生竞赛获奖

面向全校师生组建机器人Future社团,指导学生参加RoboMaster机器人大赛,累计荣获国家竞赛奖励300余项、省级竞赛奖励90余项。其中,带领战队于2020年荣获第十九届全国大学生机器人RoboMaster全国赛-团体超级对抗赛国家级竞赛一等奖;战队的宣传视频当机器人撞上抖肩舞获得大赛官方推广,多平台观看量破5万,并获得2020年单项赛全国一等奖;2022年团队集体获得1066vip威尼斯下载首届五四青年奖章。

代表性论文

[1]    Y.Wu, D.Tao*, Y.Luo, J.Cheng, X.Li. Covered Style Mining via Generative Adversarial Networks for Face Anti-spoofing. Pattern Recognition. 132:108957(2022)(IF=8.518)

[2]    Y.Wu, D.Tao*, Y.Zhan, C.Zhang. BiN-Flow: Bidirectional Normalizing Flow for Robust Image Dehazing. IEEE Transactions on Image Processing. 32:6635-6648(2022)(IF=11.041)

[3]    Y.Wu, D.Tao*, Y.Zhan, C.Zhang. Adversarial UV-Transformation Texture Estimation for 3D Face Aging. IEEE Transactions on Circuits and Systems for Video Technology. 32(7):4338-4350(2022)(IF=5.859)

[4]    F.Wu, J.Cheng, X.Wang, L.Wang, D.Tao. Image Hallucination from Attribute Pairs. IEEE Transactions on Cybernetics. 52(1):568-581(2022)(IF=11.079)

[5]    W.Wu, D.Tao*, H.Li, Z.Yang, J.Cheng. Deep features for person re-identification on metric learning. Pattern Recognition. 110:107424(2021)(IF=8.518)

[6]    H.Li, Y.Chen, D.Tao*, Z.Yu*, G.Qi. Attribute-Aligned Domain-Invariant Feature Learning for Unsupervised Domain Adaptation Person Re-Identification. IEEE Transactions on Information Forensics and Security. 16:1480-1494(2021)(IF=7.231)

[7]    K.Zhu, R.Wang, Q.Zhao, J.Cheng*, D.Tao*. A Cuboid CNN Model with an Attention Mechanism for Skeleton-Based Action Recognition. IEEE Transactions on Multimedia. 22(4):885-896(2020)(IF=8.182)

[8]    M.Meng, M.Lan, J.Yu, J.Wu*, D.Tao. Constrained Discriminative Projection Learning for Image Classification. IEEE Transactions Image Processing. 29:186-198(2020)(IF=11.041)

[9]    C.Deng, X.Yang, F.Nie, D.Tao*. Saliency Detection via a Multiple Self-Weighted Graph-Based Manifold Ranking. IEEE Transactions on Multimedia. 22(4):885-896(2020)(IF=8.182)

[10] H.Li, S.Yan, Z.Yu*, D.Tao*. Attribute-Identity Embedding and Self-Supervised Learning for Scalable Person Re-Identification. IEEE Transactions on Circuits and Systems for Video Technology. 30(10):3472-3485 (2020)(IF=5.859)

[11] Z.Ma, J.Cheng*, D.Tao. Online learning using projections onto shrinkage closed balls for adaptive brain-computer interface. Pattern Recognition. 97(2020)(IF=8.518)

[12] S.Fu, W.Liu*, D.Tao. Y.Zhou, L.Nie. HesGCN: Hessian graph convolutional networks for semi-supervised classification. Information Sciences. 514:484-498(2020)(IF=8.233)

[13] H.Li, Y.Wang*, Z.Yang, R.Wang, X.Li, D.Tao*. Discriminative Dictionary Learning-Based Multiple Component Decomposition for Detail-Preserving Noisy Image Fusion. IEEE Transactions on Instrumentation and Measurement. 69(4):1082-1102(2020)(IF=5.332)

[14] D.Tao*, J.Cheng*, Z.Yu, K.Yue, L.Wang. Domain-Weighted Majority Voting for Crowdsourcing. IEEE Transactions on Neural Network and Learning Systems. 30(1):163-174(2019)(IF=8.793)

[15] X.Ma, W.Liu*, S.Li, D.Tao, Y.Zhou*: Hypergraph p-Laplacian Regularization for Remotely Sensed Image Recognition. IEEE Transactions on Geoscience and Remote Sensing. 57(3):1585-1595(2019)(IF=8.125)

[16] W.liu*, X.Ma, Y.Zhou*, D.Tao, J.Cheng. p-Laplacian Regularization for Scene Recognition. IEEE Transactions on Cybernetics. 49(8):2927-2940(2019)(IF=11.079)

[17] J.Lei, Q.Luan, X.Song, X.Liu, D.Tao*, M.Song*. Action Parsing-Driven Video Summarization Based on Reinforcement Learning. IEEE Transactions on Circuits and Systems for Video Technology. 29(7):2126-2137(2019)(IF=5.859)

[18] L.Zhou, G.Du, R.Wang, D.Tao*, L.Wang, J.Cheng*, J.Wang. A tensor framework for geosensor data forecasting of significant societal events. Pattern Recognition. 88:27-37(2019)(IF=8.518

[19] H.Li, J.Xu, J.Zhu, D.Tao*, Z.Yu. Top distance regularized projection and dictionary learning for person re-identification. Information Sciences. 502:472-491(2019)(IF=8.233

[20] D.Tao, Y.Guo, Y.Li, X.Gao*. Tensor Rank Preserving Discriminant Analysis for Facial Recognition. IEEE Transactions Image Processing. 27(1):325-334(2018)(IF=11.041)

[21] D.Tao*, Y.Guo, B.Yu, J.Pang, Z.Yu. Deep Multi-View Feature Learning for Person Re-Identification. IEEE Transactions on Circuits and Systems for Video Technology. 28(10):2657-2666(2018)(IF=5.859)

[22] H.Li, X.He, D.Tao*, Y.Tang, R.Wang. Joint medical image fusion, denoising and enhancement via discriminative low-rank sparse dictionaries learning. Pattern Recognition. 79:130-146(2018)(IF=8.518

[23] D.Tao*, J. Cheng, X. Gao, X. Lin, C.Deng. Robust Sparse Coding for Mobile Image Labeling on the Cloud. IEEE Transactions on Circuits and Systems for Video Technology. 27(1):62-72(2017)(IF=5.859)

[24] D.Tao*, X. Lin, X.Gao. Large Sparse Cone Non-negative Matrix Factorization for Image Annotation. ACM Transactions on Intelligent Systems and Technology. 8(3):1-37(2017)(IF=4.654)

[25] Y.Guo, D.Tao*, W.Liu, J.Cheng. Multiview Cauchy Estimator Feature Embedding for Depth and Inertial Sensor-Based Human Action Recognition. IEEE Transactions on Systems, Man, and Cybernetics: Systems. 7(4):617-627(2017)(IF=11.471)

[26] Y.Yang, C.Deng, D.Tao*, S.Zhang, W.Liu, X.Gao. Latent Max-Margin Multitask Learning with Skelets for 3D Action Recognition. IEEE Transactions on Cybernetics. 47(2):439-448(2017)(IF=11.079)

[27] Y.Wang, Z.Wang, D.Tao*, S.Zhuo, X.Xu, S.Pu, M.Song. AllFocus: Patch-Based Video Out-of-Focus Blur Reconstruction. IEEE Transactions on Circuits and Systems for Video Technology. 27(9):1895-1908(2017)(IF=5.859)

[28] R.Hong*, L.Li, J.Cai, D.Tao, M.Wang, Q.Tian. Coherent Semantic-Visual Indexing for Large-Scale Image Retrieval in the Cloud. IEEE Transactions on Image Processing. 26(9):4128-4138(2017)(IF=11.041)

[29] Y.Yang, C.Deng, S.Gao, W.Liu, D.Tao, X.Gao. Discriminative Multi-instance Multitask Learning for 3D Action Recognition. IEEE Transactions on Multimedia. 19(3):519-529(2017)(IF=8.182)

[30] X.Yang, W.Liu*, D.Tao, J.Cheng, S.Li. Multiview Canonical Correlation Analysis Networks for Remote Sensing Image Recognition. IEEE Geoscience Remote Sensing Letter. 14(10):1855-1859(2017)IF=5.343

[31] X.Yang, W.Liu*, D.Tao*, J.Cheng. Canonical correlation analysis networks for two-view image recognition. Information Sciences. 385:338-352(2017)(IF=8.233)

[32] D.Tao, L.Jin, Y.Yuan, Y.Xue. Ensemble Manifold Rank Preserving for Acceleration-based Human Activity Recognition. IEEE Transactions on Neural Networks and Learning Systems. 27(6):1392-1404(2016)(IF=14.255)

[33] Y.Guo, D.Tao*, J.Cheng, A.D, Y.Li, K.Yue, B.Zhang. Tensor Manifold Discriminant Projections for Acceleration-Based Human Activity Recognition. IEEE Transactions on Multimedia. 18(10):1-11(2016)(IF=8.182)

[34] D.Tao*, Y.Guo, M.Song, Y.Li, Z.Yu, Y.Tang. Person Re-Identification by Dual-Regularized KISS Metric Learning. IEEE Transactions on Image Processing. 25(6):2726-2738(2016)(IF=11.041)

[35] D.Tao*, X.Lin, L.Jin, X.Li. Principal Component 2-Dimensional Long Short-Term Memory for Font Recognition on Single Chinese Characters. IEEE Transactions on Cybernetics. 46(3):756-765(2016)(IF=11.079)