您的当前位置:首页DNA序列分析系统的开发应用_李晓艳

DNA序列分析系统的开发应用_李晓艳

2024-07-19 来源:爱问旅游网
一E一rnail:xJI@dnszsneten叩电脑知识与技术Nounn:hnttpyW/ww86一dnzsnetelT6569096422AugutZO14eTl:+55165690963一DNA,序列分析系统的开发应用玉冰晓艳张李(河南师范大学计算机与信息工程学院河南新乡450307):摘要02世纪90年代人类基因组计划的启动有力推动了DNA测序工作的发展寻找某些特征片段(功能片段)在序列中的分布规律对遗传学生物信息学等都有重要的应用意义在教学研究中发现应用数学分析软件MATLAB的字符串处理功能可以容易地达到功能片段分析的目的本系统通过分析DNA序列链之间的关联程度构造出特征矩阵根据talb的图像显示功能将聚类的最终结果清楚明了的模糊c均值算法较准确的对DNA序列的集合进行了分类同时利用。a显示在图像中使用户能清楚的看到聚类效果本系统主要研究了DNA链碱基序列分析多个DNA链特征矩阵提取模糊c均值聚类算法分类DNA等三大部分首先该系统对DNA序列的总长度和功能序列的长度进行了测量利用一维数序列中的位置特征从而完成了对DNA碱基序列的分析;其次该系统对用户给出的数个DNA链进行序列之间的特征分析统计出每个序列的(ATCG)碱基密度得到一个特征矩阵有效的为模糊聚类分析方法提供数据来源最终该系统应用模糊C均值聚类算法利用特征矩阵的数值将数个DNA序列聚类并分为两类组确定功能片段在DNA关键词模糊C均值;特征片段;系统开发:中图分类号:TP311:文献标识码A:文章编号1009一3044(2014)22一5220一031概述自从1953tso年Wan和C血k提出DNA双螺旋结构模型以来探索DNA一级结构的工作就广泛开展根据模糊C均值算法可以较准确的对DNA序列的集合进行分类模糊C均值聚类算法分类DNA指的是根据模糊聚类的方法利用特征矩阵的数值将数个DNA序列分为两类系统可以显示出分类后的DNA序列所对应的序列号以及聚类后的分布图像本系统主要研究了DNA链碱基序列分析多个DNA链特征矩阵提取模糊C均值聚类算法分类DNA等三大部分2运行软件和运行环境运行软件21.本系统使用定功能的实现22.mtlaa7bo或以上版本作为运行库它所具有的非常低的硬件要求和多平台支持确保DNA序列分析系统系统各预运行环境P在ll40/4M以上的各种PC6机上运行可运行于wind*nn98wid二55200wid*5xPnwid*57等操作系统能打印A3纸张和A4纸张的打印机3系统分析设计31.功能需求分析根据DNA序列分析的具体情况软件需具备以下四大功能)DNA链碱基序列分析1DNA链碱基序列分析指的是对于给定的某个DNA链对某个功能片段出现的特征做简单的分析首先测量出DNA序列的总长度和功能序列的长度然后利用一维数组确定功能片段在DNA序列中的位置特征系统可以提供出现的次数以及每一个功能序:列出现时前后的碱基并利用图像更加直观的表达2)多个DNA链特征矩阵提取多个DNA链特征矩阵提取指的是对于给出的数个DNA链找到序列之间的特征统计出每个序列的(A工CG)碱基密度得到一个特征矩阵为模糊聚类分析方法提供数据来源)模糊C均值聚类算法3模糊C均值聚类算法分类DNA指的是根据模糊聚类的方法利用特征矩阵的数值将数个DNA序列分为两类系统可以显示收稿日期30作者简介李晓艳女;张玉冰(1991一)男河南宜阳县人本科生主要研究方向为通信工程::214一006一2520软件设计开发本栏目责任编辑谢媛媛第卷第期年月222oo与技术夕电脑知识出分类后的序列所对应的序列号以及聚类后的分布图像本系统应用数学分析软件MATLAB的字符串处理功能容易地达到功能片段分析的目的同时通过分析DNA序列链之间的关联程度构造出特征矩阵根据模糊C均值算法较准确的对DNA序列的集合进行了分类主要研究了DNA链碱基序列分析多个DNA链特征矩阵提取模糊C均值聚类算法分类DNA等三大部分系统同时也提供了图像属性分析功能图像表示是应用在DNA序列分析方面的强有力的可视化工具它能够揭示蕴藏在DNA序列中的结构和功能的生物信息本系统提供有DNA链碱基序列位置分布图像分析和DNA序列组模糊聚类图像分析两大部分快捷有效地提取出需要的数据结果32.作业流程分析现有的作业流程从导人数据到打印结果共有5个步骤基本上每一步都要手动干预最终将数据保存到移动设备中33系统框架结构设计.本系统提供良好的用户界面实现简洁的操作流程快捷有效地为生物基因工作者提供基因数据筛选的便利改善和提高工作效率系统结构如图1所示:图1系统界面采用传统的菜单栏方式从界面选项菜单可以看出主要有四大部分新建打开打印帮助可以帮助用户快速打开新建页面保存打印以及查看有关软件资料等功能界面正中间采用单调简约的黑白背景设置直观大方给用户良好的使用视觉环境4关键技术的实现聚类分析41.模糊C均值聚类算法分类DNA指的是根据模糊聚类的方法利用特征矩阵的数值将数个DNA序列分为两类系统可以显示:出分类后的DNA序列所对应的序列号以及聚类后的分布图像下面是DNA聚类分析的核心代码%%%用模糊C均值聚类s=X[,A];I=rzeros(404);ofi=l:40l([s(lln=eva)numZstri()]);[ofuy]=size();nrj=:l:y;ms=1(j);awitehm;Casexlil()=xlil(()+)+l;easext;,=xli2()Cli2l;Casex;xli3+l;()li3=()本栏目责任编辑谢媛媛软件设计开发5221叩asgendteeadenehg夕n电脑知识与技术rolcu第卷第期年月ge4)=xli4()+l;lienenendddmb=sux(l,;)bl=b飞c=;blblblbl」「y=sexel了ant(hdlesuitableldatay);42.图像显示本系统利用5ma软件很好地实现了数据筛选结果可观化利用不同类型的图像表示结果的不同变化特点tbla系统设计的主要创新点海量数据操控51.数据对比是相对于图表而言在图表中有时不能突出显示系统菜单选项的数据栏是主要针对数据进行的操作添加数据指的是对于源数据的导人一般是直接导人不需要手动输人的所以如果遇到有遗漏某个数据的时候可以进行直接添加再次运行筛选数据分析主要是给出筛选结果的理由就是根据什么来筛选代表DNA这个时候就需要把筛选过程中主要的数值根据显示出来比如说分类结果所以这个功能可以帮助用户找到他想要看到的聚类之后的DNA6结束语针对基因数据庞大处理繁琐筛选过程复杂等特点系统应用模糊C均值聚类思想利用简单直观的界面帮助用户实现海量基因数据筛选的操作利用mb软件特有的图像编辑功能将筛选的数据属性形象直观地表达出来ltaa经过多次尝试系统处理基因数据方便快捷结果直观可靠达到了预期的效果今后将根据用户的反馈继续完善参考文献l[]2[]3[]4[]5[]::一]软件学报200J9(1孙吉贵刘杰赵连宇聚类算法研究[81)486l刘靖明韩丽川侯立文一种新的聚类算法粒子群聚类算法.[]计算机工程与应用J]计算机工程20Jll朱颖东李红蝉基于互信息和粗糙集理论的特征选择[(巧)—200(50)2张丽新王家戚赵雁南杨泽红基于eRiel的组合式特征选择.[]复旦学报(自然科学版)J]中国新技术新产品20J1l滕达浅谈主成分分析与因子分析方法的联系与区别[(2斗f2004)5(.2522软件设计开发本栏目责任编辑谢媛媛

因篇幅问题不能全部显示,请点此查看更多更全内容