• 基于Neo4j对西藏领域本体的存储方法研究

    王飞;易绵竹;谭新;陈永升;向一帆

    基于本体语义理论构建的西藏领域本体定义了一种多属性值对的语义表示框架,建立了语义关联数据模型,将文本中的对象和事件通过语义属性联系起来,可以为多种应用提供支持。该语义表示框架可以表示成多维度的RDF数据,采用传统的关系型数据库存储会带来空间浪费和数据管理困难等问题。在大数据存储技术的推动下,产生了非关系型数据库用以存储复杂关系数据。本文主要研究了将西藏领域本体数据按照节点和边的形式存储在图数据库Neo4j中的方法,使数据库能够更有效地存储语义数据,并提供可视化的查询与处理,与传统的关系型数据库相比提高了操作效率。

    年期 [查看摘要][在线阅读][下载 212K]
  • 一种基于显式定位的机器阅读理解方法

    邓超宇;赵山;肖晓强;蔡志平

    大多数机器阅读理解模型是基于具有各种注意力机制的端到端深度学习网络,但此类模型会损失句子级别的语义信息。此外,现有数据集中的问题通常不需要复杂的推理,并且答案仅与背景段落中的少量句子相关。基于此,提出将机器阅读理解模型划分为两层:第一层用于查找段落中与问题相关的句子并生成新的背景段落;第二层则根据减小了规模的段落做进一步的答案提取。实验结果表明,在定位了相关句后预测性能有所提高。SQuAD阅读理解数据集也被划分为两部分,以适应新的框架训练需求,并使用新的数据集测试了相关内容的长度对机器阅读理解模型效果的影响。

    年期 [查看摘要][在线阅读][下载 1066K]
  • 基于BM3D的图像噪声方差估计方法

    任向阳;朱晓东;王禹博;王杰;翁政魁

    传统的图像噪声方差估计方法在处理具有较多内容变化或者丰富纹理信息的图像时,往往容易造成较大的估计偏差。提出了一种基于BM3D的图像噪声方差估计方法。该方法首先使用传统的F-NLE噪声估计方法获取图像噪声的初步估计值,并根据噪声初步估计值生成多组噪声方差候选值;然后,使用得到的噪声方差候选值作为BM3D滤波方法的参数,对含噪图像进行滤波处理;接着,在通过多组实验对图像滤波前后的自然统计(NSS)特征差异进行分析,得出该差异能够有效地反映图像降噪效果之后,对含噪图像滤波前后的NSS特征进行提取;最后,使用获取的NSS特征对应的矢量距离,作为每幅含噪图像所对应的BM3D方法参数的权重,并利用局部均值法对图像噪声方差做出最终精确估计。通过在不同图像集上的多组实验可以得出,相比于对比方法,所提出的图像噪声估计方法具有更高的估计精度和可靠性。

    年期 [查看摘要][在线阅读][下载 786K]
  • 面向制造业的可加工性矩形件优化下料方法

    黎凤洁;陈燕

    优化下料问题被广泛应用于制造行业。针对制造业中大规模、多尺寸的矩形件优化下料问题,提出一种可加工性矩形件优化下料方法,并以材料成本与切割成本总和最小为优化目标,通过多次迭代生成多个下料方案,选择最小的总成本作为最优解。采用递归算法生成由2个段组成T形排样方式:一段含水平条带;另一段含竖直条带,且都支持一刀切工艺。为了尽可能获得全局优化,优先对大矩形件进行组合优化,从而提高材料利用率。对含同种矩形件的同类型条带进行共边排样生成同质块。综合考虑同质块内条带间以及矩形件间的共边切割,从而降低切割成本。实验结果证明所提方法在保证较高材料利用率的同时,能有效减少切割刀数,对制造业中实际下料问题具有实践指导意义。

    年期 [查看摘要][在线阅读][下载 1066K]
  • 液相色谱-质谱法分析怀地黄生长期中内源性激素的变化

    王少敏;张蒙蒙;郭燕子;陈丽花;刘宏民

    植物激素在调节植物生长和发育过程中起着重要作用。首次建立了同时分析地黄叶片和块茎中脱落酸、水杨酸、吲哚乙酸、赤霉素和玉米素等5种植物激素含量的液相色谱-质谱法。目标植物激素在线性范围内的相关系数范围为0.995 9~0.999 2,方法检出限范围为0.013~0.038μg/mL,定量限范围为0.043~0.127μg/mL。日内相对标准差范围为1.7%~3.2%,日间标准差范围为3.0%~10.5%。地黄叶片和块茎中5种植物激素的回收率范围分别是81.9%~106.7%和78.4%~96.7%。接着利用此方法分析了不同怀地黄生长期中叶片和块茎中目标植物激素含量的变化特征,这将有助于了解这些植物激素在地黄生长和发育中的作用。

    年期 [查看摘要][在线阅读][下载 732K]
  • 用于空间众包任务匹配的未知工人效用估计方法

    王亦敬;陈荣;郭世凯;于茜;张程伟

    为了解决在未知工人效用情况下提高任务完成质量的问题,提出带有效用的最高分数匹配模型。该模型包含两个阶段:阶段一利用多臂老虎机模型计算工人效用值;阶段二利用更改了加分规则后的带有效用的基本方法(U-Basic)、带有效用的最小位置熵方法(U-LLEP)、带有效用的近距离优先方法(U-CDP)进行分配。在MovieLens和Gowalla真实世界数据集上的实验结果表明,所提方法与未使用效用的CDP和LLEP方法相比,一些评价指标有较大提升。

    年期 [查看摘要][在线阅读][下载 912K]
  • 一种响应时间感知的移动服务组合方法

    李靖;任丽芳;王文剑

    为了在移动环境中找到响应时间最短的组合服务,设计了一种可计算的移动模型,根据此模型过滤掉响应时间较长的组合服务,提出了移动组合服务中组件服务的选择方法。通过前馈神经网络建立组合服务与其响应时间之间的回归模型,利用基于神经网络的服务组合(neural network-based service composition,NNSC)算法选择出响应时间最短的组合服务。仿真实验结果表明,与一些启发式算法相比,NNSC算法可以找到响应时间更短的组合服务。

    年期 [查看摘要][在线阅读][下载 1470K]
  • 基于卷积神经网络的多光谱掌纹识别技术

    刘雪微;王磊;章强;王继帅;李选普

    在多光谱掌纹图像采集设备研发的基础上,提出一种基于卷积神经网络的多光谱掌纹识别方法。该方法使用ResNet-18网络对掌纹图像进行特征提取,应用特征级融合方法并将融合后的特征送入SVM分类器中进行决策。实验结果表明,所提出的多光谱掌纹识别方法可以有效提升掌纹图像特征判别效率,相比于单光谱方法和传统的神经网络算法具有更高的识别准确率。

    年期 [查看摘要][在线阅读][下载 827K]
  • 基于相关主题模型和多层知识表示的文本情感分析

    马长林;王涛

    将相关主题模型和多层知识表示方法相结合开展文本情感分析研究。首先,针对传统分割算法的不足和主题间相关关系,采用相关主题模型对文本进行主题特征分割,构造主题先验信息输入预训练语言模型;其次,基于主题先验信息和相关关系向量,采用预训练的语言模型嵌入进行文本词的动态表示,能有效解决一词多义的问题;最后,使用双向长短期记忆模型对文本句子进行表示,考虑每个词的前后信息来捕捉句子的位置信息,在句子表示向量的信息抽取中融入注意力机制,使用多头抽取考虑全局的方式,可以抽取更全面的文本信息。

    年期 [查看摘要][在线阅读][下载 664K]
  • 基于一致性正则化与熵最小化的半监督学习算法

    邵伟志;潘丽丽;雷前慧;黄诗祺;马骏勇

    在一致性正则化与熵最小化的基础上提出一种新的半监督学习算法Mean Mixup,集成数据的互补信息,然后使用熵最小化给未标记数据生成可靠的伪标签,在一致性正则化下进一步优化模型分类结果。在常用数据集SVHN和CIFAR10上对Mean Mixup算法进行了评估,实验结果表明,所提出的方法在分类准确率上优于一些已有的半监督学习算法。

    年期 [查看摘要][在线阅读][下载 873K]
  • 基于ALBERT-CRNN的弹幕文本情感分析

    曾诚;温超东;孙瑜敏;潘列;何鹏

    提出一种结合ALBERT预训练语言模型与卷积循环神经网络(convolutional recurrent neural network, CRNN)的弹幕文本情感分析模型ALBERT-CRNN。首先使用ALBERT预训练语言模型获取弹幕文本的动态特征表示,使得句子中同一个词在不同上下文语境中具有不同的词向量表达;然后利用CRNN对特征进行训练,充分考虑了文本中的局部特征信息和上下文语义关联;最后通过Softmax函数得出弹幕文本的情感极性。在哔哩哔哩、爱奇艺和腾讯视频三个视频平台的弹幕文本数据集上进行实验,结果表明,ALBERT-CRNN模型在三个数据集上的准确率分别达到94.3%、93.5%和94.8%,相比一些传统模型具有更好的效果。

    年期 [查看摘要][在线阅读][下载 978K]
  • 面向高速乱序流的top-k连续查询方法

    武守晓;房俊

    提出一种面向高速乱序流的top-k连续查询方法。使用基于缓存的方法等待迟到元组,但不对缓冲区内数据进行排序,通过统计运行信息实现缓存时长自适应,然后使用改造的MinTopk算法计算当前窗口的top-k结果集。实验结果表明,该方法在高速乱序流上实现了高效的top-k查询,在保证用户允许的最小正确率的情况下,计算出最小缓存时长,减少了查询时延。

    年期 [查看摘要][在线阅读][下载 918K]
  • 基于Django印刷体维吾尔文识别系统的设计与实现

    熊黎剑;吾守尔·斯拉木;许苗苗

    光学字符识别技术(optical character recognition,OCR)在图书数字化、文献管理等诸多领域得到了广泛应用,而相比于已十分成熟的中文、英文印刷体识别系统,小文种(维吾尔文)印刷体识别还有研究空间和实际应用需求。针对传统识别方法特征表示不足等问题,结合日益兴起的深度学习技术,采用Python语言编程,选用经改进的卷积循环神经网络作为识别算法核心,并利用Django设计系统框架。实验表明,印刷体维文识别系统的精度达到95.7%,平均速度达到12.5 fps。该系统实现了端到端的维文整词识别。

    年期 [查看摘要][在线阅读][下载 1108K]
  • 融合差分进化思想的自适应人工蜂群算法

    封硕;刘琨

    针对人工蜂群算法求解复杂优化函数时,存在收敛速度慢、算法后期种群多样性下降以及易陷入局部最优解等缺点,提出了一种融合差分进化思想的自适应人工蜂群算法。首先,引入反向学习策略初始化种群,增加种群的多样性,加强算法跳出局部最优解的能力。其次,将雇佣蜂搜索过程与差分进化算法融合,并加入自适应策略平衡算法的勘探与开发能力。最后,在侦查蜂阶段引入混沌序列,增加种群的多样性,加快算法的收敛速度。为验证本文算法的寻优性能,针对8个基准函数,选取ABC算法、DE算法、PSO算法、EABC算法、ABC/best/1算法以及本文算法分别测试。实验结果表明,本文算法在求解精度和收敛速度方面明显提高,易于跳脱局部最优解。

    年期 [查看摘要][在线阅读][下载 1373K]
  • 基于重叠网格法的斜拉索涡激振动分析

    王贵春;曹宗恒

    斜拉索为细长结构,其阻尼比较小,容易发生涡激振动。为研究斜拉索涡激振动响应特性,结合CFD方法和重叠网格技术,对斜拉索二维模型进行了研究。利用CFD软件Fluent求解二维不可压缩粘性流体Navier-Stokes方程,并通过Fluent提供的UDF接口,嵌入自编Newmark-β法程序,求解两自由度结构动力响应方程。研究结果表明:相较于低质量比涡激振动响应,斜拉索涡激振动振幅较低,但其可能造成的疲劳破坏不容忽视;斜拉索涡激振动的锁定区间很短,对风速的变化比较敏感;斜拉索运动轨迹也更加丰富,不再是单一的“8”字形运动。

    年期 [查看摘要][在线阅读][下载 1558K]
  • 基于BERT与XGBoost的航天科技开源情报分类

    刘秀磊;孔凡芃;谌彤童;刘旭红

    航天科技开源情报文本内容较长且含有大量专有名词,影响了情报分类的效果,为了提升相关情报的分类准确率,提出一种基于BERT与XGBoost融合模型的航天科技开源情报分类算法。首先通过BERT模型的深度结构提取情报中的关键特征,然后利用XGBoost模型取代BERT最后的输出层,并依据BERT提取到的关键特征对相关情报进行分类。为了验证算法的有效性,设计了与TextRCNN、DPCNN等部分主流语言模型的对比实验,实验结果表明该算法在航天科技开源情报分类中的准确率与TextRCNN、DPCNN模型相比,分别提高了1.9%、2.2%,证明了该算法在相关分类任务中的有效性。

    年期 [查看摘要][在线阅读][下载 1072K]
  • 可变模糊云模型电能质量综合评估

    郭嘉琦;蒋建东

    为准确评估大容量工业负荷接入对电网造成的电能质量影响,提出了一种可变模糊云模型电能质量综合评估方法。首先建立电能质量评估指标体系,使用模糊层次分析法与变异系数法的结果计算主客观综合权重,通过加权的方式反映多指标对评估的影响。根据可变模糊集思想,将样本数据对限值区间的相对隶属度作为加权平均的权值,改进逆向云模型特征值计算方法,使用正向云模型确定电能质量标准等级云模型。在得到电能质量标准等级云模型与样本数据云模型的基础上,计算云相似度得到电能质量评估等级。最后以典型负荷电弧炉为例,使用文中方法进行电能质量综合评估,验证了方法的准确性和有效性。

    年期 [查看摘要][在线阅读][下载 1026K]
  • 基于法院判决文书的法律知识图谱构建和补全

    王宁;刘玮;兰剑

    由于法律领域知识图谱专业性强、结构复杂,而现有的关系抽取方法因各个领域的需求和术语不同,无法适用于法律领域知识图谱的构建和补全。提出了基于StanfordNLP关系抽取机制的法律知识图谱构建方法;然后,构建基于设置谓语导向词的深度学习模型对法律知识图谱进行补全;最后,选用典型案例(伪卡盗刷判决书)作为文本对象验证模型的可行性。与其他知识图谱补全模型相比,本模型的准确率达到95%以上。基于谓语导向词的深度学习模型综合了自动构建和人工参与,提高了关系抽取的准确率和补全的效率,能最大程度挖掘判决书文本中的深层隐式关系,更好地发挥判决书文本的应用技术。

    年期 [查看摘要][在线阅读][下载 651K]
  • 基于LogGED-GPD模型的巨灾损失分布拟合

    王永茂;杨晓婷

    近年关于巨灾损失分布模型的研究方法多采用单一分布模型,或具有固定权重的组合分布模型。在对数广义误差分布(LogGED)的基础上,运用广义帕累托分布(GPD)拟合数据的厚尾部分,并加入可变权重组合分布模型的拟合思路,构建了可变权重的对数广义误差-广义帕累托组合分布模型(LogGED-GPD)。并对全球洪水巨灾损失进行了实证分布拟合,验证了可变权重的对数广义误差-广义帕累托组合分布模型的拟合效果更好,一定程度上为今后洪水巨灾损失的分析方法提供了参考依据。

    年期 [查看摘要][在线阅读][下载 517K]
  • 能源区块链的架构、应用与发展趋势

    佘维;白孟龙;刘炜;宋轩;田钊

    随着能源互联网的大力推进,传统高度集中化的体系结构已不再适用,为打破集中式能源管理的局限,能源互联网逐步转变为智能分布式电力能源系统等智慧能源互联网,但仍存在组件数量庞大、数据海量以及调度分散等问题,区块链技术能为上述问题提供有效地解决方案,于是能源区块链逐渐形成并受到广泛关注。首先对能源区块链的背景和相关政策进行了介绍;其次介绍了区块链、能源区块链及其落地项目;再次总结了目前能源区块链的典型架构,包括单链式、双链式和多链式,并对比分析了这三类架构的特性及优势;然后从安全方面和优化方面总结了现有能源区块链的应用研究现状,其中安全方面包括数据安全、系统安全,优化方面包括调度优化、交易优化和系统优化;最后展望了能源区块链的未来发展趋势。

    年期 [查看摘要][在线阅读][下载 2095K]
  • 面向社交网络数据的等差数列聚类匿名算法

    刘振鹏;董姝慧;李泽园;张庆文;刘嘉航;李小菲

    针对社交网络隐私保护如何减少信息损失,实现数据可用性的问题,提出一种个性化等差数列聚类匿名分配算法(PAS-CAA)。首先对选取的初始节点进行优化,基于综合相似度进行聚类,使每个超点至少包含k个节点;区分非敏感超点集和敏感超点集,对敏感超点集采用递减等差数列进行聚类,灵活地调节保护力度,对非敏感超点集实现基本的k保护力度;最后对超点进行匿名化处理。仿真实验结果表明算法在保护社交网络用户隐私的同时可以减少信息的损失,保留统计属性,实现了社交网络的个性化隐私保护。

    年期 [查看摘要][在线阅读][下载 573K]
  • 面向积水推测的机会式感知轨迹选择

    张伟杰;於志勇;黄昉菀;朱伟平

    城市积水严重影响了城市居民的日常出行和灾害天气下城市的正常运作。及时发现城市各处是否发生积水显得尤为重要,但是以往监测城市积水的方式多是通过人为反馈、设备监测等覆盖范围小、成本较高且容易出错的方式来实现的。对深圳市部分区域进行网格划分,融合深圳市滑动雨量数据、深圳市公交线路轨迹数据、深圳市水务局积涝水位数据,并提取相关特征,使用孤立森林算法、压缩感知算法对所有积水监测站点的积水状态进行推测,最后结合群智感知,选取公交车来参与感知任务采集积水数据提高推测准确度。

    年期 [查看摘要][在线阅读][下载 654K]
  • 基于ARM指针认证的信息流控制系统

    张立强;陈青松;严飞

    为了解决物联网设备中的安全隔离和隐私数据泄露问题,对类Unix操作系统线程中的信息流控制进行研究,基于ARM指针认证的硬件安全扩展和分散式信息流控制模型,通过对线程添加安全标签和完整性标签,实现进程地址空间的细粒度安全隔离,内存共享保护和安全多线程;通过内核安全原语和安全检查钩子有效防止线程间未授权的数据访问。实验结果表明,基于硬件辅助的信息流控制系统可以获得显著的性能提升,原型系统在实际的物联网程序用例(OpenSSL和Apache HTTP服务器)中,运行时内存占用增加了210kB,平均性能开销不超过3.66%。

    年期 [查看摘要][在线阅读][下载 805K]