一、微软提出“.NET”之后(论文文献综述)
曹士杰[1](2021)在《基于算法-硬件协同设计的高性能人工智能计算》文中研究指明大数据和深度学习的兴起使得人工智能在视觉、语音和语言等应用领域取得了革命性的突破。数据、算法和算力是人工智能取得巨大成功的三要素。上层应用的数据规模和算法规模与日俱增,对硬件算力的需求呈指数级增长。然而随着摩尔定律和登纳德缩放比例定律的停滞,通用处理器的性能提升显着放缓。因此,人工智能应用面临硬件算力需求和供应之间的巨大差距。实现高性能人工智能计算是学术界的研究热点也是工业界人工智能应用落地的迫切需求。算法-硬件协同设计同时在算法端减少对算力的需求,在硬件端带来性能提升,是实现高性能人工智能计算的重要方法。本文结合人工智能领域特性,通过分析算法设计和硬件设计对计算和访存特性的需求矛盾,提出了一套高性能人工智能计算的算法-硬件协同设计方法,其核心内容包括面向硬件优化算法和面向算法定制硬件。本文的研究工作以该算法-硬件协同设计方法为指导原则,围绕数据规模增长和算法规模增长带来的巨大算力需求,针对搜索引擎数据检索和深度学习模型推理选取了四个具体问题进行研究以实现高性能计算。具体研究内容如下:(1)搜索引擎海量互联网数据的快速选取。搜索引擎的选取服务为了选取匹配用户查询的文档,需要对海量的互联网数据进行检索。即使部署了大量的CPU,计算和访存密集的选取服务依然面临着高延迟,低吞吐和高能耗的挑战。本文对选取服务的关键部分匹配计算和索引读取进行了算法优化和硬件定制,提出了基于FPGA的选取服务专用加速器系统。具体地,本文在算法端基于剪枝减少了索引查询量和匹配计算量,在硬件端通过电路微结构设计定制了流水并行的匹配处理器和高效的索引流读取器。使用必应搜索的真实索引数据和查询日志进行实验评估,该系统可以显着降低选取服务的平均延迟和尾部延迟,并提高吞吐量。(2)深度神经网络权值稀疏的模型有效性和硬件高效性权衡。近年来深度神经网络的模型参数量和计算量呈指数级增长。权值稀疏化具有很好的模型压缩效果,同时也引入了不规则计算和访存,对并行计算硬件并不友好。结构化稀疏可以解决硬件高效性的问题,但是对模型准确率和压缩率产生了极大影响。本文同时从模型有效性和硬件高效性的角度对权值稀疏进行需求分析和协同设计,提出了组平衡权值稀疏模式。组平衡稀疏化算法将权值矩阵划分为大小相同稀疏度相同的组以进行并行计算,在组内采用非结构化稀疏以保证模型的准确率。实验表明,组平衡稀疏具有与非结构化稀疏几乎相同的模型压缩效果,且优于其他结构化稀疏;为组平衡稀疏设计实现的GPU加速库相比较于其他稀疏模式的GPU加速库,实现了显着的性能提升。(3)基于权值稀疏的LSTM网络低延迟推理。LSTM网络广泛应用于语言语音等延迟敏感的应用中。为了实现LSTM网络的低延迟推理,本文将组平衡稀疏模式应用到LSTM网络中,提出了基于FPGA的组平衡稀疏LSTM推理加速器。矩阵向量乘法是LSTM模型推理中计算最密集的部分,该FPGA加速器结合稀疏矩阵的组平衡特性,定制了负载均衡和访存规则的高并行矩阵向量乘法核心,因此对于批处理大小为1的LSTM模型推理也能实现低延迟。实验表明,与之前使用不同压缩技术的LSTM网络FPGA加速器相比,基于组平衡稀疏的LSTM网络FPGA加速器实现了显着的延迟降低。(4)基于特征稀疏的CNN模型高效推理。卷积神经网络产生的特征图中存在大量的稀疏性,利用特征稀疏可以避免大量无效的计算和访存,从而降低模型推理的负担。本文提出了一种新的基于数值量化预测特征稀疏的CNN推理加速框架。基于低比特数值量化的特征稀疏预测方法具有轻量性和通用性的优势,并且不需要对模型进行重训练。利用预测出的特征稀疏作为卷积计算的输出稀疏,该框架可以剪枝模型推理中大量零值对应的无效前序计算。实验表明,低比特量化网络可以准确地预测特征稀疏性,且对模型的总体准确率几乎没有影响;该框架的CPU实现显着减少了卷积计算量并加速了CNN模型推理。综上所述,本文的研究工作基于算法-硬件协同设计为人工智能面临性能瓶颈的代表性应用和算法提出了高性能计算方案,希望可以为未来研究提供借鉴和参考,促进高性能人工智能计算和算法-硬件协同设计的发展。
王立辉[2](2021)在《基于卷积神经网络的行人检测与跟踪算法研究》文中研究说明行人检测与跟踪是计算机视觉领域中重要的组成部分,广泛应用于智能视频监控和人机交互等领域。通过对行人进行检测并获取其运动轨迹,实现对行人目标持续跟踪。受行人快速运动、姿态变化、遮挡等因素干扰,行人检测跟踪算法在实际应用中存在准确度低、鲁棒性差、速度慢等问题。本文针对这些问题从改进卷积神经网络结构角度对行人检测与跟踪算法进行研究,主要有以下几点:(1)针对传统的行人检测与跟踪算法进行跟踪时准确度低的问题,提出一种基于GhostNet与注意力机制结合的行人检测与跟踪算法。该算法将YOLOv3的主干网络替换为GhostNet,依靠线性变换得到丰富行人目标特征的多通道特征图,降低特征几何变化的影响;融入注意力机制给予重要特征更高的权值,引入目标检测的直接评价指标GIoU来指导回归任务。实验结果表明所提算法平均测试精确度(mAP)达到了92.53%,结合Deep-Sort算法跟踪时准确度优于改进前及其它算法,可以精确有效地跟踪复杂场景下的多目标行人并具有较强的鲁棒性。(2)针对YOLOv5l网络在行人检测过程中实时性不足的问题,使用MobileNetV2中的倒残差块构建Light CSP模块来替换YOLOv5l网络中的特征提取网络并对模型进行剪枝。在Crowdhuman数据集上验证了算法的实时性。(3)针对Deep-Sort多目标跟踪算法IDSwitch较高和速度慢的问题,对DeepSort多目标跟踪算法进行改进,检测阶段改用YOLOv5l-MobileNetV2行人检测模型,将检测结果送入训练好的网络以提取行人表观特征,并结合卡尔曼滤波器进行运动估计。跟踪阶段引入全局轨迹记忆机制来降低ID切换的次数。在MOT-16数据集上实验结果证明,改进算法有效解决了行人被遮挡跟丢再出现时IDSwitch高的问题,同时满足了行人跟踪的实时性要求。
刘文翰[3](2021)在《基于改进YOLO算法的智能视频巡检辅助系统设计与开发》文中提出我国是一个工业生产大国,在化工企业中,对设备状态及厂区人员行为的定期巡检是企业运营过程中不可或缺的环节。如今化工行业的巡检大多仍然依赖人工,巡检效率低下。并且在巡检过程中容易出现“偷工减料”——巡检不到位、不够时的现象,长此以往极其容易发生事故。因此亟需智能巡检系统辅助或替代人工巡检。近些年人工智能技术发展迅速,智慧工厂的概念应运而生,学者对工业智能巡检的研究也逐步深入。在化工企业日常巡检的背景下,本文将目标检测技术与之融合。通过不断改进、优化YOLO算法,提高了准确率。最终将改进算法嵌入到智能视频巡检辅助系统,满足了辅助人工巡检的要求。本文主要研究工作如下:(1)分析智能监控以及不安全行为检测的国内外研究现状,结合在化工企业的实习经验找出日常巡检中的痛点,并对此构思解决方案,初步设计系统功能。(2)掌握时下流行的目标检测算法的工作原理,复现、分析各个算法。通过对比各算法的优劣性并结合巡检过程识别实时性以及准确率的要求,最终选择YOLO作为原型网络进行改进和优化。(3)对算法进行了五处改进,最终得到DDCN-YOLO模型。首先,从训练数据集入手,使用数据增强及Mosaic方法来丰富数据集背景,以加强网络在复杂环境下的目标分辨能力;其次,采用了DBSCAN-K-Means++聚类算法对模型中的Anchor Box重新聚类,用以提高对图像中小目标的识别率;再次,为了防止图像特征随网络深度增加逐渐被削弱,本文在网络中使用DenseNet替代ResNet;另外,本文又将可变卷积DCN与原有网络结合,以增加感受野;最后,加重了损失函数中坐标损失的权重。通过实验,准确率较YOLOv4提高了2.33%,并降低了小目标的漏检率。同时经过纵向和横向的对比,均验证了模型性能。(4)系统使用Python语言进行开发,在TensorFlow 2.0深度学习开发框架下进行模型训练,其中训练图片来自网络爬取以及人工拍摄。经过训练,实现了人员闯入、火焰、吸烟及未佩戴安全帽四种不安全行为的识别。系统人机交互界面的制作选用PyQt5开发框架,系统后台使用MySQL关系型数据库管理信息,系统开发IDE选用PyCharm,将训练好的改进模型嵌入到系统中,最终完成开发。
李乃寒[4](2021)在《面向语音合成的深度学习算法研究与应用》文中研究表明语音合成(speech synthesis,又名text-to-speech,TTS)是人机交互的重要方法之一,旨在合成清晰且自然的音频。语音合成的应用场景非常广泛,比如手机和个人电脑的语音助手、同声传译的语音输出环节、车载导航播报、新闻朗读等等。通过语音合成,可以解放用户的眼睛,使人能在“眼观”的同时还可以“耳听”,增加信息接收的带宽。最近,随着神经网络的快速发展,端到端的语音合成模型逐渐进入人们的视野。这表现在两个方面:一方面,由于自然语言处理(natural language process,NLP)领域的飞速发展,尤其是机器翻译领域的推进,用于序列到序列转换的模型(如Seq2seq,Transformer)日趋成熟,且表现出了优异的性能,为语音合成打下了坚实的模型基础;另一方面,端到端的神经语音合成模型表现出了强大的性能,表现在省去了复杂的前端,转而借用神经网络模型以端到端的方式直接将文本转换为可以高效描述声学特征的表示方法,例如频谱或者梅尔谱。本文主要针对语音合成的三大基础问题,即自然度、鲁棒性以及“文本-音频”对齐进行了探索研究。在自然度方面,本文提出了Transformer TTS,首次将Transformer通过与Tacotron2结合的方式应用到语音合成领域,进一步提高了生成语音的自然度;同时,Transformer TTS缩短了训练时间,并且能够在任意两个时间步之间建立起直接的依赖关系。在鲁棒性方面,本文首先对于之前的神经语音合成模型鲁棒差的问题进行了分析,得出其鲁棒性受限的几个关键因素;并且基于这些分析提出了Robu Trans,该模型既能保持Tacotron2和Transformer TTS的自然度,又可以极大地提高鲁棒性,避免生成异常音频的情况。另外,“文本-音频”对齐是语音领域一个重要的基础研究问题。在这个方面,本文提出了基于神经网络的对齐模型Mobo Aligner,其利用一种全新的注意力机制,能够在梅尔谱中单调地搜索文本单元的边界,从而得到二者对齐。相比Transformer TTS,Mobo Aligner可以得到更准确的对齐,并且减少了45%的参数量和30%的训练时间。
李环[5](2020)在《基于轻量级卷积神经网络的交通场景目标检测算法研究》文中研究指明近年来,自动驾驶成为了世界范围内的各大汽车公司和互联网公司的研究热点,而自动驾驶领域的高级驾驶员辅助系统已得到了广泛的应用。目标检测是高级驾驶员辅助系统的关键算法之一。在汽车辅助驾驶的场景中,对于目标检测的实时性要求较高,且城市道路场景复杂,目标间相互有严重的遮挡,多数目标在该场景下的面积占比较小。因此针对这种复杂场景设计高效的目标检测系统具有挑战性。本文研究基于深度卷积神经网络的目标检测方法,并使用公开数据集KITTI作为实验的训练集和测试集,主要的研究工作包括:首先,针对高级驾驶员辅助系统对于实时性与内存的要求,本文对RetinaNet进行轻量化改造,使用PeleeNet作为骨干网络并优化分类回归子网,提高检测速度,降低网络复杂度,方便算法以后在硬件上的移植;其次,基于数据集的先验信息设计更合理的锚点框,进而提高检测精度;然后,通过融合三层次特征并结合注意力机制进一步提高模型的检测性能;最后,基于PeleeNet-RetinaNet检测模型,提出一种对部分增强多尺度特征图进行自适应空间特征融合(Adaptively Spatial Feature Fusion-ASFF)的特征金字塔,在降低参数量和运算量的同时,保持较高的检测性能。在KITTI数据集上进行实验,结果表明本文提出的基于ASFF的PeleeNet-RetinaNet检测模型的性能优于基于ResNet-50的RetinaNet检测模型,而参数数量仅为其13.9%,检测速度是其3.14倍。
陈扬[6](2020)在《基于多模态信号的点击率预估模型研究》文中研究指明点击率(click-through-rate,CTR)预估是指信息推送给用户后,用户点击浏览这则信息的概率,而在本文特指针对搜索和电商广告的点击率预估。研究显示,用户点击的概率性与信息的投放位置有很大的相关性,为了收益最大化就需要把点击率大的信息投放在用户浏览页面靠前的位置。准确的CTR预估既能有效的利用广告位资源,也可以帮助实现千人千面的商品推荐,为广告平台带来可观的经济收益。同时,在信息过剩的时代背景下,对于用户而言,CTR预估也可以利用精准推荐帮助用户节省寻找信息的时间。传统的点击率预估模型主要依靠类别特征和数值特征来表征一则广告内容,已经无法适应当前图文并茂的信息。文字描述以及图片质量、内容,都对点击率有不可忽略的影响。为了更好地将这些多模态信号纳入我们的CTR模型,本文进行了如下研究:第一,针对CTR预估在文本特征的处理和学习上面临的挑战,本文设计了一种基于注意力机制的循环神经网络CTR模型。第二,针对于CTR预估在引入图像信号特征的过程中,在模型设计上的缺陷和物料侧的图像特征利用不足的问题,本文在物料侧设计了一种新型的基于深度神经网络的CTR模型。最后本文在数据集上进行了实验,证明了我们设计的模型的有效性。
冉龙宇[7](2020)在《基于深度强化学习的高效能云任务调度算法研究》文中提出云计算是现代信息社会重要的基础设施,云任务调度作为云计算中最重要的一项技术,直接关乎用户和云服务提供商的利益。传统的云任务调度算法往往采用固定的策略进行调度,这类算法实现简单,同时拥有较高的调度效率,在一定程度上解决了离线任务调度问题。随着云计算的广泛应用和任务调度规模日益增加,在线任务调度存在数据中心集群高异构性、集群运行环境和任务提交数量高波动性、优化目标多样性等问题,传统的算法不能够动态的改变自己的调度策略来高效的进行在线任务调度。近年来,深度强化学习在理论研究上取得了巨大的成功,本文旨在研究基于深度强化学习的云任务调度算法来改善上面的问题。本文的主要内容及贡献如下:1)在单数据中心任务调度的场景下,针对数据中心集群高异构性问题,本文通过对深度强化学习中智能体的动作、状态和奖励进行建模,提出了基于改进深度Q学习算法的云任务调度算法。为了增强智能体的探索能力,算法中使用了Boltzmann动作探索策略对传统的动作探索策略进行改进。在模拟数据集上的实验显示,该算法拥有良好的收敛性,CPU利用率标准差降低了6.7%,有效促进了集群负载均衡,任务的指令响应时间比提升了5.3%,实现了高效能的云任务调度;2)针对云计算中任务的高波动性、高不确定性,本文考虑了多个任务之间的相关性,每次对多个任务同时进行调度,但是在强化学习中,这会导致智能体的状态空间爆炸,因此,本文提出了基于改进深度确定性策略梯度算法的任务调度算法。为了满足集群负载均衡的优化目标,算法中使用最早任务调度算法来改进动作探索策略。在离线训练Actor网络时,存在收敛速度慢的问题,本文添加了一个有监督的训练方法来加快算法的收敛速度。在阿里云的集群跟踪数据上进行的实验显示,该算法的指令响应时间比提升了3.3%,有效提升了多个任务同时调度时的效率;3)在多数据中心任务调度的场景下,针对多目标优化问题,本文使用成本感知的动作策略改进了原始的深度确定性策略梯度算法。在阿里云的集群跟踪数据上进行的实验显示,该算法在保证任务指令响应时间比和集群负载均衡的情况下,平均每小时降低了1.3元的集群使用成本,有效解决了多目标优化问题;4)本文参考开源云计算仿真平台CloudSim Plus,自主设计实现了Python语言版的云任务调度仿真系统,有效提升了仿真实验的速度和便捷性。
周路宽[8](2020)在《基于特征增强与中心采样的无锚框目标检测算法研究》文中研究表明目标检测是计算机视觉领域一个热门问题,它不仅广泛地应用于工业检测和智能驾驶等实际场景,也对解决人脸检测和实例分割等更复杂的视觉问题有着重要的作用。近年来,随着深度学习的发展,深度神经网络凭借其强大的特征提取能力和优异的表现性能被广泛地应用于目标检测任务当中,诞生了一些经典算法,并在相关领域展现出了巨大的应用价值。然而,尽管目标检测算法已经取得了巨大的成功,却仍然在尺度变化、采样等方面存在着巨大问题:第一,目标尺度的变化对特征融合问题提出了新的要求。但是,常见的特征融合方法缺少对特征的选择,融合方式较为简单,不同层次特征间信息传递困难,有一定局限;第二,无锚框目标检测算法近年来成为新的研究热点。但是,由于无锚框检测算法发展并不成熟,仍然存在着边缘样本质量不佳、损失函数无法差异化处理某些场景等弊端。这些问题限制了算法性能的进一步提升。为了解决上述问题,本文提出了一种用于特征增强的基于注意力机制的全内联特征金字塔网络,并在多任务、损失函数设计和采样策略等方面进行改良,得到了一个优异的无锚框检测器,本文主要工作如下:1、提出了基于注意力机制的全内联特征金字塔网络IFPN,用于特征增强。它可以在特征融合时实现良好的特征选择,并使得不同层次的特征可以自由地融合。此外,它可以同时作用于基于锚框与无锚框的检测算法,迁移性较好。2、提出了一种基于中心采样的目标检测算法C-FCOS。它使用更加准确的复合置信度来指导非极大值抑制过程,同时采取基于收缩初始化和动态权重的改进损失函数,并使用边缘过滤的中心点采样策略来提高样本的质量。3、本文对模型输入进行了优化,并使用加速库进行数据预处理和推理的加速,从而极大地提高了算法的实时检测速度,增加了算法的实用性。本文涉及到了基于锚框的多阶段和单阶段检测算法,以及最新的无锚框检测算法,并在MS COCO数据集上进行了大量的实验,证明了IFPN的有效性库与C-FCOS的良好效果。在此基础上,本文改进了算法的效率,具有广泛的应用价值。
牟相霖[9](2020)在《基于云存储的分布式教学视频处理系统》文中研究说明随着互联网的发展,网络教学系统需求十分旺盛,视频教学素材的处理成为比较重要的研究和应用领域。教师在对1080P或4K的视频素材进行处理时面临巨大挑战;此外部分教学内容还存在隐私保护的问题。实验室承担的广东省中医院“名老中医保护传承”的项目中,不但对高性能实时视频处理有较高的需求,还需对教学视频中的病人进行一定的隐私保护。论文针对以上教学视频素材处理的问题,开展“人眼自动识别打马赛克”的相关算法研究,让保护视频的病人隐私算法可以达到实时或接近实时地自动处理,同时研究并实现了一个基于云存储的分布式高性能教学视频处理系统,借助GPU云端处理系统,支持多名教师在学习系统的网课制作过程中,利用云端对教学视频内容进行转码、调整分辨率等以满足不同的视频传输带宽需求。本文的主要贡献如下:1、本文研究并实现了一个完整的“人眼自动打马赛克”,保护人的隐私系统,该系统分别由人脸检测、人脸验证和人眼特征点检测三部分组成。人脸检测算法主要基于Face Boxes(脸框)网络结构进行改进,改进之后,以运算时间轻微提升作为代价,将平均准确率由86.4%提高到90.4%。人脸验证算法基于Mobile Face Nets(移动人脸网络)进行改进,使得人脸验证准确率几乎保持不变的情况下,CPU的运算速度提升了近4倍,由38FPS提高到132FPS。人眼特征点检测模块我们设计了一个6层的神经网络用于从人脸中检测出18个人眼特征点。最终我们将三个模块组成完整的人眼自动打马赛克系统,该系统可以对1024×1024分辨率的视频实现CPU上94.3ms/帧和GPU上18.9ms/帧的速度(达到每秒25帧的实时处理速度),并且对中医诊断视频中患者打马赛克的准确率达到了83.4%的平均交并比,初步满足了要求。此外我们还在早期就提出对打马赛克的人脸进行人脸验证实验的思路(基本上与对抗神经网络概念类似);2、本文完成了一个支持多用户和多任务的基于云存储的分布式教学视频处理系统,该系统将本地教学视频处理任务转移到云端,并且利用GPU的硬件加速能力,实现了视频裁剪、转码、调整分辨率、调整比特率和人眼打马赛克等功能的加速。实验表明,单任务模式下GPU加速后的视频处理系统相对于个人PC提高了至少5倍以上速度,处理后的素材,可以直接传送给教学平台,极大提高了教学视频处理效率,也避免了教师在个人计算机上的摸索。以上的算法和系统已经完成,针对该系统申请了一个软着和一个专利,主要工作在2019年12月8日参加了“第五届下一代互联网技术创新比赛”并且荣获了全国二等奖,全国排名第4名。目前本系统已经投入试用,并取得了较好的效果。
李官清[10](2020)在《海杂波下雷达弱小目标检测的深度学习方法研究》文中认为海杂波下的弱小目标检测一直是雷达检测跟踪识别领域的重难点问题。该课题在军事、民用上均有重要应用,军事方面可以用来检测潜望镜、远距离水面舰艇、掠海飞行器等,民用上可用来监控海上偷渡、非法贸易、预防船只相撞。高海况下,海杂波的后向电磁散射特性较强,雷达回波中的目标信号容易被海面浪、涌造成的海尖峰掩盖,给检测带来困难。传统的雷达目标检测方法存在诸多缺陷,低信杂噪比下虚警较多、海杂波复杂多变,传统方法在拟合其分布时容易出现失配。本课题针对传统检测方法的不足,运用深度学习技术,将雷达回波中的目标信号检测问题转化为“杂波”或“杂波+目标”的二元分类问题,通过网络自动提取杂波和目标在变换域的不同特征从而进行分类。本课题旨在研究有效的杂波抑制算法和特征提取算法,来减少虚警、提升检测速度,提高复杂海面环境下雷达对弱小目标的检测性能。本文的具体内容安排如下:第二章首先分析了南非科学工业理事会(CSIR)的雷达海面小目标检测数据集,并对目标的时域和频域特性进行分析,然后用传统的二维CFAR方法进行检测,并指出传统的二维CFAR方法存在对海杂波的适应性不强的问题。主要内容包括CSIR数据集的雷达参数、风速海况、目标特性,和距离-多普勒二维平面上的单元平均二维恒虚警率(CA-CFAR)检测等内容。第三章提出了基于STFT和改进的Tiny-Yolov2网络的雷达弱小目标检测算法,以解决传统的二维恒虚警率检测存在较多虚警的问题。首先通过短时傅里叶变换(STFT)提取回波的时频特征,得到雷达回波的时频图像数据集。由于CNN对样本容量有较高要求而雷达回波数据有限,而光学数据容易获取,因此接着在光学数据集上研究了小样本下的目标检测问题,验证了Tiny-Yolov2网络在小样本下的有效性,并研究了网络有效学习所需要的样本容量。然后,针对雷达时频图数据集,对Tiny-Yolov2模型做出了滤波器设计、数据增强、非极大值抑制等改进,提出了基于改进的Tiny-Yolov2网络的检测算法。最后,在雷达时频数据集上验证了算法的有效性,结果表明网络的检测性能较好,虚警概率较低,检测速度较快。第四章提出了一种CNN框架下的海杂波抑制算法(DA-CCS)。使用卷积层、池化层、上采样层这三个能保留空间位置信息的层来提取特征,得到的类激活图(CAM)能将网络学习到的标签反向映射到输入图像中的特定区域,具备物理可解释性。本章首先分析了CNN的分类原理和参数求解算法,然后推导了本文所提出的DA-CCS算法的网络模型和检测流程,并对运算量进行了分析。接着用卷积层、池化层和全连接层构造网络对雷达时频图像数据集进行分类,研究了网络结构、大小、深度、优化算法的对分类结果的影响,以及算法对不同载频的雷达回波进行检测的泛化能力。最后,在实测雷达数据集上验证了DA-CCS算法的有效性,本文所提算法在检测精度上优于近期提出的基于稀疏傅里叶变换的系列算法,且检测速度快,具备实时检测的潜力。第五章为全文结论与下一步工作的展望。
二、微软提出“.NET”之后(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、微软提出“.NET”之后(论文提纲范文)
(1)基于算法-硬件协同设计的高性能人工智能计算(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题背景及研究的目的和意义 |
1.1.1 课题的背景:算力的需求和供应差距 |
1.1.2 高性能人工智能计算的目的和意义 |
1.2 国内外研究现状 |
1.2.1 通用处理器和领域专用架构 |
1.2.2 人工智能芯片 |
1.2.3 深度神经网络模型压缩与加速 |
1.2.4 现有研究中存在的不足 |
1.3 本文的主要研究内容 |
第2章 算法-硬件协同设计 |
2.1 引言 |
2.2 算法设计和硬件设计矛盾 |
2.3 高性能人工智能计算的算法-硬件协同设计方法 |
2.3.1 协同设计流程 |
2.3.2 算法优化方法 |
2.3.3 硬件定制方法 |
2.3.4 细粒度协同设计空间探索 |
2.4 本章小结 |
第3章 基于FPGA的搜索引擎选取服务加速 |
3.1 引言 |
3.2 背景和相关工作 |
3.2.1 选取服务 |
3.2.2 选取服务性能瓶颈分析 |
3.3 FlexSaaS异构加速器系统 |
3.3.1 系统概述 |
3.3.2 匹配算法-匹配处理器协同设计 |
3.3.3 索引流读取微结构定制 |
3.3.4 统一存储访问 |
3.3.5 系统灵活性和可扩展性支持 |
3.4 实验与分析 |
3.4.1 FlexSaaS系统实现 |
3.4.2 FPGA资源利用 |
3.4.3 加速分析 |
3.4.4 系统整体性能 |
3.5 本章小结 |
第4章 基于组平衡稀疏的模型压缩与加速 |
4.1 引言 |
4.2 背景和相关工作 |
4.2.1 非结构化稀疏与结构化稀疏 |
4.2.2 权值稀疏模型有效性和硬件高效性的权衡 |
4.3 组平衡稀疏神经网络 |
4.3.1 组平衡稀疏:硬件友好型稀疏模式 |
4.3.2 深度神经网络的组平衡剪枝(稀疏化)算法 |
4.3.3 组平衡稀疏矩阵乘法的GPU实现 |
4.4 实验与分析 |
4.4.1 组平衡剪枝分析 |
4.4.2 GPU矩阵乘法基准测试 |
4.4.3 不同任务和模型的实验结果 |
4.4.4 组大小分析 |
4.5 本章小结 |
第5章 基于FPGA的组平衡稀疏LSTM网络加速 |
5.1 引言 |
5.2 背景和相关工作 |
5.2.1 LSTM网络 |
5.2.2 稀疏神经网络硬件加速 |
5.3 基于FPGA的组平衡稀疏矩阵计算和存储 |
5.3.1 高并行稀疏矩阵向量乘法设计 |
5.3.2 无需解码的稀疏矩阵存储格式 |
5.4 基于FPGA的组平衡稀疏LSTM加速器 |
5.4.1 系统概述 |
5.4.2 稀疏矩阵向量乘法单元 |
5.4.3 向量按位操作单元 |
5.4.4 控制器 |
5.5 实验与分析 |
5.5.1 实验设置 |
5.5.2 量化组平衡稀疏模型 |
5.5.3 组平衡稀疏LSTM的FPGA加速器高效性 |
5.5.4 讨论:英伟达细粒度结构化稀疏和稀疏张量核 |
5.6 本章小结 |
第6章 基于数值量化预测特征稀疏的CNN加速 |
6.1 引言 |
6.2 背景和相关工作 |
6.2.1 卷积神经网络中的特征稀疏 |
6.2.2 模型稀疏化与数值量化相关工作 |
6.3 SeerNet设计与实现 |
6.3.1 基于数值量化预测特征稀疏 |
6.3.2 基于特征稀疏剪枝卷积计算 |
6.4 实验与分析 |
6.4.1 数据集和模型 |
6.4.2 模型整体准确率 |
6.4.3 推理加速 |
6.4.4 量化预测分析 |
6.5 本章小结 |
结论 |
参考文献 |
攻读博士学位期间发表的论文及其他成果 |
致谢 |
个人简历 |
(2)基于卷积神经网络的行人检测与跟踪算法研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 行人检测研究现状 |
1.2.2 行人跟踪研究现状 |
1.3 行人检测与跟踪面临的挑战 |
1.4 本文主要内容和结构安排 |
第2章 目标检测与多目标跟踪理论基础 |
2.1 卷积神经网络 |
2.2 YOLO目标检测算法 |
2.2.1 YOLOv3检测算法 |
2.2.2 YOLOv4检测算法 |
2.2.3 YOLOv5检测算法 |
2.3 经典的多目标跟踪算法 |
2.4 本章小结 |
第3章 基于GhostNet与注意力机制的行人检测跟踪算法 |
3.1 引言 |
3.2 YOLOv3-GhostNet-SE行人检测方法 |
3.2.1 YOLOv3多尺度预测 |
3.2.2 GhostNet算法 |
3.2.3 SE注意力机制 |
3.2.4 YOLOv3-GhostNet-SE检测算法 |
3.3 基于GhostNet与注意力机制的行人检测跟踪算法 |
3.3.1 轨迹处理和状态估计 |
3.3.2 数据关联和级联匹配 |
3.4 实验结果与分析 |
3.4.1 实验环境及参数设置 |
3.4.2 数据集和评价指标 |
3.4.3 检测算法结果分析 |
3.4.4 跟踪结果分析 |
3.5 本章小结 |
第4章 改进YOLOv5l的轻量型实时行人检测算法 |
4.1 引言 |
4.2 YOLOv5l-MobileNetV2目标检测模型 |
4.2.1 YOLOv5l检测网络 |
4.2.2 MobileNetV2网络倒残差块 |
4.2.3 改进型YOLOv5l网络结构 |
4.3 实验结果与分析 |
4.3.1 实验环境及参数设置 |
4.3.2 实验结果分析与对比 |
4.4 本章小结 |
第5章 改进Deep-Sort的行人跟踪算法 |
5.1 引言 |
5.2 卡尔曼滤波运动模型 |
5.3 全局轨迹记忆机制 |
5.4 行人跟踪算法流程 |
5.5 实验结果与分析 |
5.6 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
致谢 |
参考文献 |
附录1 攻读硕士学位期间发表的论文 |
附录2 攻读硕士学位期间参加的科研项目 |
(3)基于改进YOLO算法的智能视频巡检辅助系统设计与开发(论文提纲范文)
摘要 |
abstract |
1 绪论 |
1.1 课题背景及研究意义 |
1.2 国内外研究现状 |
1.2.1 智能监控的研究现状 |
1.2.2 安全帽佩戴及吸烟检测的研究现状 |
1.3 课题研究内容及章节安排 |
1.3.1 主要研究内容 |
1.3.2 章节安排 |
2 基于深度学习的目标检测算法研究 |
2.1 人工神经网络与深度学习 |
2.2 深度学习与目标检测 |
2.2.1 基于卷积神经网络的图像识别 |
2.2.2 目标检测 |
2.3 本章小结 |
3 YOLO算法的改进 |
3.1 数据增强 |
3.2 Anchor Box重新聚类 |
3.3 引入DenseNet网络 |
3.4 引入可变卷积 |
3.5 损失函数的改进 |
3.6 实验及结果评估 |
3.7 本章小结 |
4 智能视频巡检辅助系统设计与开发 |
4.1 系统设计 |
4.1.1 编程语言及数据库的选择 |
4.1.2 系统流程设计 |
4.2 模型训练 |
4.2.1 数据集 |
4.2.2 图像标记 |
4.2.3 模型训练及结果分析 |
4.3 系统开发 |
4.3.1 开发过程 |
4.3.2 系统功能演示 |
4.4 本章小结 |
5 总结与展望 |
5.1 总结 |
5.2 前景展望 |
参考文献 |
致谢 |
攻读学位期间发表学术论文目录及研究成果 |
(4)面向语音合成的深度学习算法研究与应用(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究工作的背景与意义 |
1.2 国内外研究历史与现状 |
1.2.1 声学模型 |
1.2.2 声码器 |
1.2.3 其他相关模型 |
1.3 本文的主要内容概述 |
1.3.1 现存方法的不足 |
1.3.2 本文的研究内容 |
1.4 本论文的结构安排 |
第二章 语音基础 |
2.1 语言学概述 |
2.2 发音 |
2.2.1 发音器官 |
2.2.2 国际音标 |
2.3 辅音和元音 |
2.3.1 辅音 |
2.3.2 元音 |
2.3.3 英语的发音 |
2.4 本章总结 |
第三章 语音合成与神经网络基础简介 |
3.1 早期语音合成 |
3.1.1 语音合成的发展历程 |
3.1.2 基于统计参数的语音合成模型 |
3.2 神经网络基础 |
3.2.1 神经元 |
3.2.2 全连接网络 |
3.2.3 卷积神经网络 |
3.2.4 循环神经网络 |
3.2.5 Seq2seq模型 |
3.2.6 Transformer模型 |
3.2.7 Flow模型 |
3.3 本章总结 |
第四章 语音合成的自然度 |
4.1 神经语音合成 |
4.1.1 经典声学模型:Tacotron2 |
4.1.2 经典声码器:Wavenet |
4.2 Transformer TTS:将Transformer应用到语音合成 |
4.3 网络结构 |
4.3.1 字形-音素转换器 |
4.3.2 缩放的位置编码 |
4.3.3 Pre-net |
4.3.4 编码器和解码器 |
4.3.5 输出层和Post-net |
4.4 实验 |
4.4.1 训练设置 |
4.4.2 字形-音素转换器 |
4.4.3 声码器 |
4.4.4 训练时间对比 |
4.4.5 自然度的评价指标 |
4.4.6 实验结果 |
4.4.7 对照试验 |
4.5 本章小结 |
第五章 语音合成的鲁棒性 |
5.1 先前的神经语音合成不鲁棒的原因 |
5.1.1 不受限制的编码器-解码器注意力机制 |
5.1.2 不准确的终止预测 |
5.1.3 未见过的位置编码 |
5.2 单调的注意力机制 |
5.2.1 Forward attention |
5.2.2 GMM attention |
5.3 RobuTrans |
5.3.1 文本-语言学特征转换器 |
5.3.2 时长预测模块 |
5.3.3 伪非因果注意力机制 |
5.3.4 去掉位置编码 |
5.4 实验 |
5.4.1 基准线模型 |
5.4.2 训练设置 |
5.4.3 测试设置 |
5.4.4 声码器 |
5.4.5 实验结果 |
5.4.6 其他注意力机制 |
5.4.7 异常分析 |
5.4.8 对照试验 |
5.5 本章小结 |
第六章 快速的声学模型和文本与音频的对齐 |
6.1 非自回归的声学模型及其对齐方式 |
6.1.1 基于Transformer的模型 |
6.1.2 基于Flow的模型 |
6.1.3 基于TransformerTTS的对齐模型 |
6.2 单调的注意力机制 |
6.2.1 基本思想 |
6.2.2 上下文向量的期望计算 |
6.2.3 修改过的能量公式 |
6.2.4 每帧权重之和小于1 |
6.2.5 将对齐权重离散化 |
6.3 MoBoAligner |
6.3.1 文本编码器 |
6.3.2 梅尔编码器 |
6.4 MoboAligner注意力 |
6.4.1 公式化表示 |
6.4.2 张量并行计算实现 |
6.4.3 将对齐权重离散化 |
6.4.4 用隔帧抽取的方法加速 |
6.4.5 测试阶段 |
6.5 实验 |
6.5.1 数据集 |
6.5.2 训练设置 |
6.5.3 对齐结果的可视化 |
6.5.4 对齐的基准线模型 |
6.5.5 结果 |
6.5.6 与强制对齐模型的对比 |
6.6 本章小结 |
第七章 全文总结与展望 |
7.1 全文总结 |
7.2 后续工作展望 |
致谢 |
参考文献 |
攻读博士学位期间取得的成果 |
(5)基于轻量级卷积神经网络的交通场景目标检测算法研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 背景与意义 |
1.2 研究现状与分析 |
1.3 论文的主要工作 |
1.4 论文组织与架构 |
第二章 基于卷积神经网络的目标检测算法 |
2.1 卷积神经网络 |
2.2 基于卷积神经网络的目标检测算法 |
2.2.1 两阶段检测算法 |
2.2.2 单阶段检测算法 |
2.3 本章小结 |
第三章 基于Pelee-SSD的车辆行人检测 |
3.1 实验数据集与评价指标 |
3.1.1 KITTI数据集 |
3.1.2 评价标准 |
3.2 基于Pelee-SSD的车辆行人检测 |
3.2.1 Pelee网络模型 |
3.2.2 锚点框的设置 |
3.3 实验结果及分析 |
3.3.1 实验环境及参数设置 |
3.3.2 实验结果分析 |
3.4 本章小结 |
第四章 基于RetinaNet的轻量级车辆行人检测 |
4.1 RetinaNet基础模型的建立与基准实验 |
4.2 针对汽车驾驶环境的轻量级目标检测 |
4.2.1 模型结构的调整与实验验证 |
4.2.2 锚点框优化与实验验证 |
4.2.3 特征融合架构的改进与实验验证 |
4.3 本章小结 |
第五章 基于ASFF的 RetinaNet检测模型 |
5.1 引言 |
5.2 融合ASFF和 RetinaNet的车辆行人检测 |
5.2.1 ASFF算法 |
5.2.2 融合ASFF和 RetinaNet |
5.3 预测网络的改进 |
5.4 本章小结 |
总结与展望 |
参考文献 |
攻读硕士学位期间取得的研究成果 |
致谢 |
附件 |
(6)基于多模态信号的点击率预估模型研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景 |
1.1.1 研究背景 |
1.1.2 CTR预估与机器学习 |
1.2 问题和挑战 |
1.2.1 基于深度神经网络的CTR预估模型在处理文本信号上的不足 |
1.2.2 现有CTR预估模型在物料侧对图像信号统一建模问题 |
1.3 本文研究工作 |
1.3.1 基于文本信号的多模态信号输入模型 |
1.3.2 基于图像信号的多模态信号输入模型 |
1.4 论文结构 |
第二章 相关工作 |
2.1 基于集成学习的CTR预估模型 |
2.2 基于深度学习的CTR预估模型 |
2.2.1 Deep Crossing算法 |
2.2.2 PNN模型 |
2.2.3 Google Wide&Deep模型 |
2.2.4 华为Deep FM |
2.2.5 阿里Deep Interest Notwork模型 |
2.2.6 Google Deep&Cross模型 |
2.3 基于多模态信号输入的CTR预估模型研究 |
2.4 注意力机制技术 |
第三章 基于文本信号的多模态信号输入模型 |
3.1 引言 |
3.2 深度文本多模态网络(DTMN) |
3.2.1 深度文本多模态网络的整体结构 |
3.2.2 门控循环单元(GRU) |
3.2.3 循环神经网络+注意力机制 |
3.3 实验及其分析 |
3.3.1 数据集介绍 |
3.3.2 实验细节 |
3.3.3 实验环境设置 |
3.3.4 实验结果及分析 |
3.3.5 案例分析 |
第四章 基于图像信号的多模态信号输入模型 |
4.1 引言 |
4.2 深度图像多模态网络(DIMN) |
4.2.1 深度图像多模态网络的整体结构 |
4.2.2 基于VGG-16 的图像特征提取 |
4.3 实验及分析 |
4.3.1 实验细节 |
4.3.2 实验环境设置 |
4.3.3 实验结果及分析 |
4.3.4 案例分析 |
第五章 总结 |
5.1 工作总结 |
结束语 |
致谢 |
参考文献 |
作者在学期间取得的学术成果 |
(7)基于深度强化学习的高效能云任务调度算法研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 研究背景意义 |
1.2 国内外研究现状 |
1.2.1 云计算和云任务调度 |
1.2.2 深度强化学习 |
1.3 论文主要工作及贡献 |
1.4 论文的组织结构 |
第2章 云任务调度及深度强化学习概述 |
2.1 云计算中的任务调度 |
2.1.1 云任务调度基本流程 |
2.1.2 云任务调度优化目标 |
2.1.3 云任务调度常见算法 |
2.2 强化学习理论基础 |
2.2.1 马尔科夫决策过程 |
2.2.2 常用强化学习方法 |
2.3 深度强化学习理论基础 |
2.3.1 深度神经网络模型 |
2.3.2 深度Q学习算法 |
2.3.3 深度确定性策略梯度算法 |
2.4 本章小结 |
第3章 基于深度强化学习的云任务调度 |
3.1 场景建模与优化目标 |
3.1.1 云任务调度环境建模 |
3.1.2 优化目标公式化 |
3.2 基于深度Q学习的云任务调度 |
3.2.1 状态空间、动作空间、奖励函数设计 |
3.2.2 Boltzmann动作探索策略 |
3.2.3 云任务调度算法设计 |
3.3 基于深度确定性策略梯度的云任务调度 |
3.3.1 状态空间、动作空间、奖励函数设计 |
3.3.2 基于最早调度算法的动作探索策略 |
3.3.3 动作网络离线训练改进方法 |
3.3.4 云任务调度算法设计 |
3.4 仿真实验及结果分析 |
3.4.1 实验环境及配置 |
3.4.2 实验数据 |
3.4.3 基于深度Q学习的云任务调度算法实验 |
3.4.4 基于深度确定性策略梯度的云任务调度算法实验 |
3.5 本章小结 |
第4章 基于深度确定性策略梯度的多数据中心云任务调度 |
4.1 场景建模与优化目标 |
4.1.1 多数据中心云任务调度环境建模 |
4.1.2 优化目标公式化 |
4.2 基于深度确定性策略梯度的多数据中心云任务调度 |
4.2.1 状态空间、动作空间、奖励函数设计 |
4.2.2 成本感知的动作探索策略 |
4.2.3 云任务调度算法设计 |
4.3 仿真实验及结果分析 |
4.4 本章小结 |
第5章 云任务调度仿真系统设计与实现 |
5.1 需求分析 |
5.2 系统总体设计 |
5.3 各功能模块设计与实现 |
5.3.1 数据生成模块 |
5.3.2 任务模块 |
5.3.3 调度算法模块 |
5.3.4 集群模块 |
5.3.5 虚拟机模块 |
5.3.6 数据存储与分析模块 |
5.4 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
作者简历及攻读学位期间发表的学术论文与研究成果 |
(8)基于特征增强与中心采样的无锚框目标检测算法研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 发展历史与研究现状 |
1.2.1 目标检测的问题描述 |
1.2.2 传统目标检测算法 |
1.2.3 卷积神经网络的发展 |
1.2.4 基于深度学习的目标检测算法 |
1.3 本文的主要内容及结构 |
第二章 相关基础理论 |
2.1 卷积神经网络基础 |
2.1.1 神经元与神经网络 |
2.1.2 反向传播算法 |
2.1.3 卷积神经网络简介 |
2.1.4 卷积神经网络的重要构成 |
2.2 网络结构介绍 |
2.2.1 Le Net5 |
2.2.2 Alex Net |
2.2.3 VGGNet |
2.2.4 Res Net |
2.3 目标检测数据集与评价指标 |
2.3.1 常见数据集 |
2.3.2 评价指标 |
2.3.3 多阶段检测算法Faster R-CNN介绍 |
2.3.4 单阶段检测算法RetinaNet介绍 |
2.4 本章小结 |
第三章 基于注意力机制的全内联特征金字塔网络 |
3.1 引言 |
3.2 相关工作 |
3.2.1 特征金字塔网络 |
3.2.2 视觉中的注意力机制 |
3.3 基于注意力机制的全内联特征金字塔网络设计 |
3.3.1 整体网络架构 |
3.3.2 基于注意力机制的特征金字塔网络 |
3.3.3 全内联模块 |
3.4 损失函数的选择策略 |
3.5 实验与分析 |
3.5.1 实验设置 |
3.5.2 实验结果与速度测试 |
3.5.3 对比实验与分析 |
3.5.4 可视化分析与结果 |
3.6 本章小结 |
第四章 基于中心采样的无锚框目标检测算法 |
4.1 引言 |
4.2 相关工作 |
4.2.1 锚框思想的缺陷分析 |
4.2.2 无锚框目标检测算法的提出与分类 |
4.2.3 无锚框目标检测算法FCOS介绍 |
4.3 基于中心采样的无锚框目标检测算法设计 |
4.3.1 整体网络架构 |
4.3.2 基于复合置信度的改进NMS算法 |
4.3.3 基于动态权重的DIo U Loss |
4.3.4 基于边缘淘汰的中心采样策略 |
4.4 实验与分析 |
4.4.1 实验设置 |
4.4.2 实验结果与速度对比 |
4.4.3 对比实验与可视化结果 |
4.5 本章小结 |
第五章 基于TensorRT与 Dali的目标检测算法加速 |
5.1 引言 |
5.2 基于高分辨率fine-tune的模型优化方法 |
5.3 TensorRT与 Dali加速 |
5.3.1 TensorRT简介 |
5.3.2 Dali简介 |
5.3.3 基于TensorRT与 Dali的加速 |
5.4 本章小节 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
作者简介 |
攻读硕士学位期间获得的成果 |
(9)基于云存储的分布式教学视频处理系统(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 研究现状 |
1.2.1 视频处理研究现状 |
1.2.2 视觉隐私保护研究现状 |
1.2.3 人脸检测研究现状 |
1.2.4 人脸验证研究现状 |
1.2.5 人眼特征点检测研究现状 |
1.3 本文研究内容及关键技术 |
1.4 本文组织架构 |
第二章 相关技术 |
2.1 深度学习 |
2.1.1 人工神经网络 |
2.1.2 反向传播算法 |
2.2 卷积神经网络 |
2.2.1 卷积层 |
2.2.2 池化层 |
2.2.3 全连接层 |
2.2.4 批量归一化层 |
2.2.5 训练卷积神经网络的常用技术 |
2.3 本章小结 |
第三章 人眼自动打马赛克算法 |
3.1 人脸检测 |
3.1.1 Face Boxes算法介绍 |
3.1.2 对Face Boxes的改进 |
3.1.3 实验测试和分析 |
3.2 人脸验证 |
3.2.1 Mobile Face Nets算法介绍 |
3.2.2 对Mobile Face Nets的改进 |
3.2.3 实验测试和分析 |
3.3 人眼特征点检测及追踪 |
3.3.1 MTCNN中的O-Net |
3.3.2 对O-Net的改进 |
3.3.3 实验测试和分析 |
3.4 人眼自动打马赛克算法及实验测试 |
3.4.1 人眼自动打马赛克算法组成 |
3.4.2 实验测试和分析 |
3.5 本章小结 |
第四章 视频处理系统的设计与实现 |
4.1 开发环境 |
4.2 系统设计 |
4.2.1 系统整体设计 |
4.2.2 系统各模块设计 |
4.2.3 系统数据库设计 |
4.3 系统实现 |
4.3.1 客户端界面 |
4.3.2 系统各模块的实现 |
4.3.3 系统各功能的实现 |
4.4 实验测试和功能验证 |
4.4.1 视频处理实验测试 |
4.4.2 系统并发测试 |
4.5 本章小结 |
第五章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
攻读硕士学位期间取得的研究成果 |
致谢 |
附件 |
(10)海杂波下雷达弱小目标检测的深度学习方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题背景及意义 |
1.2 国内外研究现状 |
1.2.1 海杂波下雷达弱小目标检测的传统方法的研究现状 |
1.2.2 目标检测识别领域深度学习技术的研究现状 |
1.2.3 海杂波下雷达弱小目标检测的深度学习方法的研究现状 |
1.3 本文的主要工作和组织结构 |
第二章 CSIR雷达数据集和对二维CFAR检测的分析 |
2.1 引言 |
2.2 CSIR雷达数据集 |
2.2.1 Fynmeet雷达简介 |
2.2.2 回波数据分析 |
2.3 二维CFAR检测算法的分析 |
2.3.1 检测原理 |
2.3.2 检测结果和分析 |
2.4 本章小结 |
第三章 基于改进的Tiny-Yolov2网络的雷达弱小目标检测 |
3.1 引言 |
3.2 基于STFT的时频特征提取方法 |
3.3 小样本下深度学习的目标检测流程和样本容量问题 |
3.3.1 检测流程 |
3.3.2 检测性能和结果讨论 |
3.4 基于改进的Tiny-Yolov2网络的检测算法 |
3.4.1 滤波器 |
3.4.2 数据增强 |
3.4.3 非极大值抑制 |
3.4.4 检测流程 |
3.5 检测结果和分析 |
3.6 本章小节 |
第四章 基于DA-CCS算法的雷达弱小目标检测 |
4.1 引言 |
4.2 CNN分类网络和参数求解算法 |
4.2.1 分类原理 |
4.2.2 参数迭代过程 |
4.2.3 分类网络的结构 |
4.3 DA-CCS算法 |
4.3.1 总体框架 |
4.3.2 数据预处理 |
4.3.3 算法流程 |
4.4 实验和结果分析 |
4.4.1 实验1:基于CNN的雷达时频图分类 |
4.4.2 实验2:基于DA-CCS算法的雷达弱小目标检测 |
4.5 本章小结 |
第五章 结束语 |
5.1 工作总结 |
5.2 研究展望 |
致谢 |
参考文献 |
作者在学期间取得的学术成果 |
四、微软提出“.NET”之后(论文参考文献)
- [1]基于算法-硬件协同设计的高性能人工智能计算[D]. 曹士杰. 哈尔滨工业大学, 2021(02)
- [2]基于卷积神经网络的行人检测与跟踪算法研究[D]. 王立辉. 武汉科技大学, 2021(01)
- [3]基于改进YOLO算法的智能视频巡检辅助系统设计与开发[D]. 刘文翰. 青岛科技大学, 2021(02)
- [4]面向语音合成的深度学习算法研究与应用[D]. 李乃寒. 电子科技大学, 2021(01)
- [5]基于轻量级卷积神经网络的交通场景目标检测算法研究[D]. 李环. 华南理工大学, 2020(02)
- [6]基于多模态信号的点击率预估模型研究[D]. 陈扬. 国防科技大学, 2020(02)
- [7]基于深度强化学习的高效能云任务调度算法研究[D]. 冉龙宇. 中国科学院大学(中国科学院重庆绿色智能技术研究院), 2020(12)
- [8]基于特征增强与中心采样的无锚框目标检测算法研究[D]. 周路宽. 东南大学, 2020(01)
- [9]基于云存储的分布式教学视频处理系统[D]. 牟相霖. 华南理工大学, 2020(02)
- [10]海杂波下雷达弱小目标检测的深度学习方法研究[D]. 李官清. 国防科技大学, 2020(02)