京橋のバイオインフォマティシャンの日常

データ分析、コマンドライン、プログラミングについての技術資料・自己アップデート・悩み事などをまとめています。最近、ディープラーニング関連のR言語の資料をまとめるべく注力してます。

R - PDF変換

R言語で、pdf2textを実行する

科学論文などは、通常、PDF形式のファイルで保管される。 このフォーマットは主に印刷用に設計されているため、検索や索引付けにはあまり適さない。 rOpenSci/pdftoolsパッケージを使えば、 PDFファイルから、テキストやメタデータを抽出できる。 今回、RでP…