阿克曼M,斯特里默K。基因集富集分析的通用模块化框架.[BMC生物信息学2009, 10:47]:作者对基因集富集分析的统计方法进行了“广泛的调查”,并确定了“大多数已发表方法的基础上的通用模块化结构”。基于这一发现,他们开发了一个检测基因集富集的一般框架,提供了基因集分析的“元理论”,“不仅有助于更好地理解每种嵌入方法的相对优点,而且有助于进行原则性比较,并提供对方法之间相对相互作用的见解,”根据论文的摘要。
安东诺夫AV, Dietmann S, Wong P, Igor R, Mewes HW。PLIPS,一个自动收集的蛋白质组学研究报告的蛋白质列表数据库.[J蛋白质组Res.2009年2月13日。]:描述了一种名为PLIPS(蛋白质组学研究中识别的蛋白质列表)的工具,该工具接受蛋白质/基因标识符列表作为输入,然后使用统计分析来推断最近发表的蛋白质组学研究,并提供与查询列表“显著交叉”的蛋白质列表报告。可用在这里.
Benoukraf T, Cauchy P, Fenouil R, Jeanniard A, Koch F, Jaeger S, Thieffry D, Imbert J, Andrau JC, Spicuglia S, Ferrier P。一个芯片上的分析套件[生物信息学.2009年2月4日。]:描述CoCAS(片上芯片分析套件),这是一个软件包,为ChiP-chip和ChIP-seq实验提供数据规范化、峰值检测和质量控制报告。可用在这里.
比格特,Söding。用于同源搜索的序列上下文特定配置文件.[美国国家科学研究院.2009年2月20日(e-pub打印前)]:根据论文的摘要,描述了一种序列比对方法“从以每个查询序列残基为中心的短窗口中获得特定于上下文的氨基酸相似性”。通过使用上下文特定的方法,称为CS-BLAST,结合NCBI Blast,作者表示,他们在“困难基准集”上将灵敏度提高了两倍以上,而不影响速度。可用在这里.
小布莱恩特DW,王伟强,莫克勒TC。QSRA -质量价值导向新创短读汇编程序.[BMC生物信息学“由于所有高通量测序平台的输出中都包含错误,短读汇编程序必须在利用所有可用数据的同时考虑到这一错误,”根据该论文的摘要。作者设计了一种新的汇编程序,质量值引导的短读汇编程序,“用来利用质量值分数作为处理错误的进一步方法。”作者声称,与之前发布的短读汇编程序相比,该汇编程序在速度和输出质量方面有了显著的改进。可用在这里.
Campagna D, Albiero A, Bilardi A, Caniato E, Forcato C, Manavski S, Vitulo N, Valle G。PASS:使短序列对齐的程序.[生物信息学.2009年2月13日。]:介绍PASS(对准短序列的程序),该程序将短DNA序列快速对齐到参考基因组上。该算法基于一个数据结构,该数据结构在RAM中保存“种子”单词的基因组位置索引和预先计算的相互对齐的短单词的分数索引。建立基因组索引后,程序扫描每个查询序列,执行三个步骤:在基因组中找到匹配的种子词;对于每一次匹配,它都会检查预先计算的短侧翼区域的对齐;它对匹配周围的狭窄区域执行精确的动态对齐。可用在这里.
[分页]
殷浩,高勇。MOM:最大寡核苷酸图谱.[生物信息学.2009年2月19日。]:描述了一个称为MOM(最大寡核苷酸映射)的短读映射程序。根据该论文的摘要,MOM改进了现有的方法,该方法假设大多数测序错误发生在读取的3'端附近。它基于查询匹配概念,“旨在在满足用户定义的错误参数的短读内捕获最大长度匹配。”根据作者的说法,与SOAP、MAQ和SHRiMP相比,该方法技术表现出更高的灵敏度和更高的唯一映射读取百分比。可用在这里.
海恩斯BC,布伦特先生。与GRENDEL进行监管网络重建的基准测试.[生物信息学.2009年2月2日作者在论文摘要中写道:“与对生物网络的自动反褶积进行的大量工作相比,对所提出的算法进行基准测试的工作相对较少。”作者在论文摘要中写道,并指出这“主要是由于缺乏完全理解的生物网络来作为黄金标准。”作为回应,他们开发了一种系统,用于对重建算法进行基准测试,该系统“得出的重建算法的相对准确性与用a - biochem(一种已建立的硅基基准)获得的结果有显著不同”。可用在这里.
Hur J, Schuyler AD, States DJ, Feldman EL。sciiminer:基于网络的文献挖掘工具,用于目标识别和功能丰富分析.[生物信息学.2009年2月2日介绍了sciiminer,这是一种基于网络的文献挖掘工具,可以通过对Medline摘要和全文的特定上下文分析来识别基因和蛋白质。可用在这里.
琼斯AR,西彭JA,哈伯德SJ,佩顿西北。通过分析多个搜索引擎的错误发现率,提高蛋白质组研究的敏感性.[蛋白质组学.2009 Feb 27;9(5):1220-1229]:描述了一种用于蛋白质搜索引擎结果的评分方法,称为FDA评分,该评分基于错误发现率,并允许来自不同搜索引擎的肽识别相结合。根据该论文的摘要,结合FDR评分可以高精度地区分正确和不正确的肽识别,“在固定的FDR上,比使用单一搜索引擎平均多出35%的肽识别。”
柯贝尔,阿比佐夫A,穆新杰,Carriero N, Cayting P,张震,Snyder M, Gerstein MB。PEMer:一个基于模拟的误差模型的计算框架,用于从大量配对端测序数据推断基因组结构变异.[基因组医学杂志.2009 Feb 23;10(2):R23]:描述配对端映射器(PEMer),一种从配对端测序数据调用结构变体的方法。PEMer包括一个可并行分析管道、基于模拟的误差模型(为每个结构变量提供置信度值)和一个后端数据库。可用在这里.
李华,丁刚,谢林,李勇。PAnnBuilder:一个用于组装蛋白质组注释数据的R包.[生物信息学.2009年2月23日。]:描述PAnnBuilder,一个R包,用于从公共资源中收集蛋白质注释信息,为大规模蛋白质组学研究提供注释数据。可用在这里.
[分页]
陆勇,司帅。基于相邻残差对齐的多序列对齐算法精度的提高.[核酸研究2009 37(2):463-472]:“虽然最近在多序列比对精度方面的大多数改进都是由于更好地利用了垂直信息,其中包括基于一致性的成对比对的结合和轮廓比对的使用,但我们观察到,在比对两个残基时,通过考虑相邻残基的比对,从而更好地利用水平信息,有可能进一步提高精度,”作者在论文摘要中指出。他们表明,他们的策略可以在蛋白质序列比对上提高高达3%的比对精度,在DNA/RNA序列比对上提高高达10%。
王国强,王志强。FORG3D:力向三维图形编辑器,用于集成基因组规模数据的可视化。[BMC系统生物学2009, 3:26]:描述了一种名为FORG3D的可视化方法和生物信息学软件工具,该软件工具基于实时三维力向图,可用于可视化基因组规模数据的集成网络,如基因或基因产物之间的相互作用,信号转导,代谢途径,功能相互作用和进化关系。可用在这里.
李志刚,李志刚,李志刚,李志刚。OnTheFly:一个自动基于文档的文本注释、数据链接和网络生成的工具.[生物信息学.2009年2月17日(e-pub ahead of print)]:介绍OnTheFly,一个基于网络的应用程序,应用生物命名实体识别来丰富微软Office, PDF和纯文本文档。可用在这里.
雷诺兹C,达默尔D,琼斯S。ProtorP:蛋白质-蛋白质相互作用分析服务器.[生物信息学2009 25(3):413-414]:描述了ProtorP服务器,它通过计算蛋白质相互作用位点的一系列物理和化学参数来分析3D结构中的蛋白质-蛋白质结合,这些参数有助于结合的结合能。可用在这里.
施瑞尔,布伦德尔。CREDO:用于药物发现的蛋白质-配体相互作用数据库.[化学生物药物.2009年2月;73(2):157-67]:讨论CREDO,一个蛋白质配体相互作用的数据库,“它将接触表示为结构相互作用指纹,实现了新颖的功能,并通过其应用程序编程接口完全可脚本化,”根据论文摘要。可用在这里.
Vanlier J, Wu F, Qi F, Vinnakota KC, Han Y, Dash RK, Yang F, Beard DA。BISEN:生化模拟环境.[生物信息学.2009年2月25日。]:讨论生化模拟环境(BISEN),一套在Matlab计算环境中模拟生化系统的工具。可用在这里.