京橋のバイオインフォマティシャンの日常

まずは、データ分析、コマンドラインのメモとして

R - rOpenSci

R言語で、pdf2textを実行する

科学論文などは、通常、PDF形式のファイルで保管される。 このフォーマットは主に印刷用に設計されているため、検索や索引付けにはあまり適さない。 rOpenSci/pdftoolsパッケージを使えば、 PDFファイルから、テキストやメタデータを抽出できる。 今回、RでP…