马斯特里赫特大学数据科学科学研究所的研究人员WafaaAljbawi在大会上表示,研究使用了剑桥大学893个音频样本数据集,语音特征由Mel-spectrogram分析法提取得到。利用语音数据,开发了长短时记忆(LSTM)、卷积神经网络(CNN)等深度学习分类模型来检测COVID-19的阳性病例。
研究结果表明,深度学习可以检测出COVID-19患者声音的微妙变化。与抗原测试相比,我们的模型的灵敏度有了明显的提高(84%vs.56.2%),但特异性较低(83%vs.99.5%)。作为其他测试技术的补充,通过简单的语音分析,这个模型可以帮助快速诊断COVID-19病例。
QRec是一个用于推荐系统的Python框架(支持Python3.7.4和Tensorflow1.14+),其中实现了一些有影响力的、最新的推荐模型。QRec有一个轻量级的架构,可以促进模型的实现和评估,并提供用户友好的界面。
LightGBMTransform在使用LightGBM时提供一种灵活且自动的方式来进行特征转换。与单独的转换相比,这种方式更有效率,也更便于开发和迭代:
ApacheSedona(incubating)是一个用于处理大规模空间数据的集群计算系统。Sedona为ApacheSpark和ApacheFlink等集群计算系统配备了一套开箱即用的分布式空间数据集和空间SQL,可以在机器间有效地加载、处理和分析大规模空间数据。
pyampute是一个Python工具库,用于生成完整数据集的缺失值(即截断)和探索不完整数据集。pyampute提供了MultivariateAmputation这个用于生成完整数据集的缺失值的转化器,还提供mdPatterns和MCARTest用于检查不完整数据集。
OSLO是大规模模型优化的开源框架。
课程涵盖了数据库和信息系统的设计、实施的基本方面。课程侧重于关系型数据库,但也将涵盖数据库以外的数据管理问题,如:交易一致性、复制、数据仓库、其他数据模型,以及SQL。在第一个链接观看课程视频,在第二个链接下载课程课件。
生物学家认为海龟是一种指示物种,其行为有助于科学家了解所在生态系统的潜在发展。生物学家使用物理标签等传统方法识别与跟踪个体海龟,但是这些标签在海水中会频繁丢失或被侵蚀,使得这种方法变得不那么可靠。
因此DeepMind与Zindi合作,发起了一项名为TurtleRecall的机器学习挑战赛,通过海龟面部各异且稳定的鳞片图案识别,提高海龟重新识别的可靠性和速度。
比赛于2021年11月开始,历时五个月,收到了来自13个不同国家的AI爱好者提交的作品。项目的更多信息可以查看上方第二个链接。
wandb是一个免费的、用于记录机器学习训练过程数据的工具,具有用户管理、团队管理、项目管理等功能。本教程包含环境设置、基础使用方法、超参数搜索、数据和模型管理、wandb本地部署等内容。
公众号后台回复关键字日报,免费获取整理好的论文合辑。
科研进展
领域任务:ImageRestoration,VariationalInference,图像生成,变分
论文作者:ArpitBansal,EitanBorgnia,Hong-MinChu,JieS.Li,HamidKazemi,FurongHuang,MicahGoldblum,JonasGeiping,TomGoldstein
论文简介:Weobservethatthegenerativebehaviorofdiffusionmodelsisnotstronglydependentonthechoiceofimagedegradation,andinfactanentirefamilyofgenerativemodelscanbeconstructedbyvaryingthischoice./我们观察到,扩散模型的生成行为并不强烈依赖于图像退化的选择,事实上,整个生成模型系列可以通过改变这种选择而被构建。
领域任务:FederatedLearning,联邦学习
论文作者:RuiSong,DaiLiu,DaveZhenyuChen,AndreasFestag,CarstenTrinitis,MartinSchulz,AloisKnoll
论文简介:Weintroduceanovelfederatedlearningframework,FedD3,whichreducestheoverallcommunicationvolumeandwiththatopensuptheconceptoffederatedlearningtomoreapplicationscenariosinnetwork-constrainedenvironments./我们引入了一个新颖的联合学习框架FedD3,它减少了整体的通信量,并由此将联邦学习的概念开辟到网络受限环境中的更多应用场景。
论文摘要:我们介绍了一个新颖的联合学习框架FedD3,它减少了整体的通信量,并由此将联邦学习的概念开辟到网络受限环境中的更多应用场景。它通过利用本地数据集的提炼而不是传统的学习方法来实现这一目标,(i)显著减少通信量,(ii)将传输限制在一次通信,而不是迭代的多路通信。FedD3不是像其他联合学习方法那样共享模型更新,而是允许连接的客户端独立提炼本地数据集,然后在整个网络中只聚合这些分散的提炼数据集(通常是以一些无法识别的图像的形式,这些图像通常比模型小)以形成最终模型。我们的实验结果表明,FedD3在所需的通信量方面明显优于其他联合学习框架,同时它还提供了额外的好处,能够根据使用场景或目标数据集,平衡准确性和通信成本之间的权衡。例如,在有10个客户端的非IIDCIFAR-10数据集上训练AlexNet模型,与其他一次性联合学习方法相比,FedD3可以在类似的通信量下提高71%以上的准确性,或者节省98%的通信量,同时达到同样的准确性。
领域任务:计算机视觉
论文作者:JonathanVentura,MiloHonsberger,CameronGonsalves,JulianRice,CamillePawlak,NatalieL.R.Love,SkylerHan,VietNguyen,KeilanaSugano,JacquelineDoremus,G.AndrewFricker,JennYost,MattRitter
论文简介:Weintroduceanoveldeeplearningmethodfordetectionofindividualtreesinurbanenvironmentsusinghigh-resolutionmultispectralaerialimagery./我们介绍了一种新型的深度学习方法,用于使用高分辨率多光谱航空图像检测城市环境中的单个树木。
论文摘要:我们介绍了一种新型的深度学习方法,用于使用高分辨率多光谱航空图像检测城市环境中的单个树木。我们使用卷积神经网络来回归显示单个树木位置的置信图,这些树木使用峰值查找算法进行定位。我们的方法通过检测公共和私人空间的树木提供了完整的空间覆盖,并且可以扩展到非常大的区域。在我们横跨南加州五个城市的研究区域,我们取得了0.735的F分数和2.157米的RMSE。我们用我们的方法制作了加州城市森林中所有树木的地图,表明我们的方法有可能支持未来前所未有的城市森林研究。