如何使用python将fasta文件中各种碱基计数
1、首先我们将fasta文件读入python(首先选定编码形式,这里我习惯用UTF-8,中文兼容性好)。
2、这里说明一下,第一个r是表示后面的路径内容不用再转义了,最后的r表示写入。
3、然后通过循环遍历文件,注意文件是带空行的注意使用.strip(),还有文件本身是大小写都有的,小写表示的是重复序列,大写表示一般序列。所以用.upper()全部统一为大写。
4、采用"str:{0}".format()的形式结合字符串,再通过str_.count("xxx")的方式来输出特定字符的个数。
5、最后看一下效果,看来A:T和C:G的比值接近于1,所以该序列较为正常。
6、最后提一下,如果想知道其互补链的序列呢?使用自带函数str就可以啦,虽然很简单也很重要哦。
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:39
阅读量:38
阅读量:35
阅读量:47
阅读量:44