李玉箫介绍
· 清华大學(xué)電(diàn)子系信息与通信工(gōng)程方向博士在读
· 目前在巴斯克应用(yòng)数學(xué)研究所访學(xué)
· 发表过十余篇所在领域顶刊顶会文(wén)章
· 國(guó)内外多(duō)个大厂、研究组织实习经历
02
结合深度學(xué)习的数据知识,以及传统推断的模型知识,让我们可(kě)以解读复杂信息。举个例子:
问:“我到最近柱子的距离是多(duō)少?”那么,传统统计推断的物(wù)理(lǐ)模型就可(kě)以解读,通过识别波峰,用(yòng)電(diàn)磁波的传播速度乘以时间就能(néng)知道距离;
如果问:“这幅图的场景有(yǒu)哪些?”图像信号是隐式的,无法建模,无法多(duō)步推理(lǐ),这时通过深度學(xué)习可(kě)以解出;
我的研究领域侧重无線(xiàn)感知,在对环境感知后,结合各类其他(tā)技(jì )术,如AI进行后续的处理(lǐ),实现对物(wù)理(lǐ)环境的重建,对环境进行分(fēn)析,对环境中(zhōng)的人与物(wù)进行识别、分(fēn)析,触发后续的动作(zuò)等。
谈及深度变分(fēn)推断框架(Deep Variational Inference Framework),主要分(fēn)為(wèi)三类。
第一类是易解概率(Tractable Likelihood)和独立潜在变量( Independent Latent Variables) 。比如说盲图像超分(fēn)(Blind Image Super-resolution),旨在对未知退化类型的低分(fēn)辨率图像进行超分(fēn)增强,由于其对于实际应用(yòng)的重要促进作(zuò)用(yòng)而受到越来越多(duō)的关注。主要分(fēn)為(wèi)显示建模(Explicit Modelling)和隐式建模(Implicit Modelling)两类方法,目前最新(xīn)的方法BSRGAN,通过对多(duō)种模糊核、下采样、噪声退化进行随机置换,在不同类型真实退化数据上取得了非常好的效果。
04
刚刚我是从无線(xiàn)通信的角度探讨深度學(xué)习,能(néng)為(wèi)传统的统计推断框架做什么。接下来我们反其道行之,讨论统计推断可(kě)以為(wèi)深度學(xué)习提供什么灵感,联系ChatGPT和大语言模型,来谈一谈。
统计阶段能(néng)為(wèi)深度學(xué)习做什么?深度學(xué)习本身,比如说大语言模型,它需要加入第一性原理(lǐ),加入经典的推断算法吗?我认為(wèi)是需要的。
ChatGPT4脱颖而出主要源于指令微调(Instruction Tuning),在多(duō)个以Instruction為(wèi)指导的大量任務(wù)进行學(xué)习,让模型在理(lǐ)解这些具(jù)體(tǐ)的指令后给出答(dá)案。
ChatGPT4的升级之处在于,不用(yòng)GPT3.5的反馈奖励模型,而采用(yòng)句式奖励模型GPT4。这也和我的研究联系起来,我会认為(wèi)把模型知识加进去,比添加新(xīn)的网络结构去诱导网络更有(yǒu)用(yòng)、更安(ān)全以及更具(jù)可(kě)解释性。
05
UEM:请问李老师,如何将深度學(xué)习应用(yòng)于不同的领域?
李玉箫:理(lǐ)论领域,目前深度學(xué)习应用(yòng)比较好的是图像和自然语言。再比如带编码的信息信号,机器學(xué)习其实很(hěn)容易在数据集上过拟合,因為(wèi)自然信号它本身就没有(yǒu)很(hěn)好的数學(xué)模型。但是在传统的,比如脑電(diàn)信号,还有(yǒu)人體(tǐ)的物(wù)理(lǐ)信号,包括我研究的无線(xiàn)信号,UWB、Wi-Fi、蓝牙这种情况下,机器學(xué)习现在必须基于传统的方法做一些增益,因為(wèi)它无法直接使用(yòng)。
UEM:未来想进入科(kē)技(jì )大厂,學(xué)习哪些领域能(néng)帮助我更好地实现职业发展目标?
李玉箫:依据我所了解的情况,如果是博士的话,可(kě)能(néng)更看重方向一点,但有(yǒu)时候需要看是否契合具(jù)體(tǐ)的某一个部门的业務(wù)方向。就这几年而言,5G、无線(xiàn)通信、物(wù)联网这一块比较火,但这一块科(kē)研界也还比较欠缺。智能(néng)驾驶这几年挺波动的,企业开的薪酬高,需承担一定风险。
另外的话,图像自然语言这一块,一个是纯的AI赛道,譬如图像、音视频、自然语言处理(lǐ)等任務(wù),薪酬高,竞争也非常激烈。但是如果拿(ná)自然语言去做一些别的事情,比如说医(yī)疗、风险评估、城市规划,那这些完全可(kě)以应对,市场也有(yǒu)很(hěn)大的需求。
当一个深度學(xué)习网络可(kě)以识别公(gōng)园中(zhōng)的一只小(xiǎo)狗,我们并不知道这个學(xué)习系统到底是聚焦在环境中(zhōng)狗的尾巴上,还是狗所在的草(cǎo)坪。如果机器學(xué)习具(jù)备举一反三、触类旁通的能(néng)力,相信AI的可(kě)解释性会大大增强。
感謝(xiè)李老师的精(jīng)彩分(fēn)享,让我们得以窥探AI深度學(xué)习的黑盒子!也欢迎你申请马德(dé)里欧洲大學(xué)的计算机科(kē)學(xué)与管理(lǐ)硕士,在职學(xué)习,斩获前沿的计算机知识。
关闭