テキスト処理
はじめに 練習用のファイルのダウンロード ファイル内のテキストに対する処理 ある特定の文字列を含む行を表示する ある特定の文字列を含まない行を表示する ある特定の文字列を含まない行を別ファイルに出力する 空白行を削除する ファイル内の行数をカウン…
はじめに テキスト処理の関連記事 python版simstringのインストール R言語で、simstringライブラリを実行してみる。 まとめ はじめに 文字列処理・テキスト処理とは、プログラミングを行うなかで、文字列・テキストに対する色々な操作のことを指します。それ…
はじめに テキスト処理の関連記事 関連パッケージをロードする 文字列の抽出/切り出しについて 文字数指定で、文字列を抽出する 文字列の検出 「月の英語表記」を「月の数字」に置換する方法について 参考資料 はじめに 文字列処理・テキスト処理とは、プロ…
はじめに テキスト処理の関連記事 下準備について 近似的文字列マッティング agrep & agrepl 関数 adist 関数 stringdist / stringdistmatrix関数で、文字列間の距離指標を計算する あとがき 参考資料 はじめに 文字列処理・テキスト処理とは、プログラミン…
はじめに テキスト処理の関連記事 下準備について 【1】完全一致で、その文字列を含むかどうかのの判定 比較演算子 == != base::match、stringr::str_match、演算子 %in% 【2】部分一致で、その文字列を含むかどうかの判定 charmatch関数、pmatch関数 grep…
はじめに テキスト処理の関連記事 下準備について 【1】文字列ベクトルの連結 base::paste0 関数・ stringr::str_c 関数 stringr::str_c 関数 【2】文字列長のカウント base::nchar 関数 stringr::str_length 関数 ・ stringr::str_count 関数 補足 format…
はじめに テキスト処理の関連記事 下準備について テキストファイルの読み込み について 【1】テキストファイルを1行ごと読み込んで、ベクトルにする。 【2】テキストファイルを文字列で読み込んで、ベクトルにする。 【3】テキストファイルを読み込んで…
はじめに 練習ファイルのダウンロード readLinesのダメな実行例 readLinesの実行コード例 まとめ R・ビッグデータ解析の処方箋 関連記事 R言語 お勧め書籍 補足 readLines関数で、10万行の同時読み込み 参考資料 はじめに 現状、数十GB・数百GBといった、…
はじめに レインボー色(grDevices::rainbow関数)の設定 レインボー・カラー 透明度 FF レインボー・カラー 透明度 80 レインボー・カラー 透明度 60 レインボー・カラー 透明度 40 レインボー・カラー 透明度 20 Rで使える他のカラーパレットについて palet…
はじめに Rパッケージのセットアップ PubMed全体でキーワード検索をやってみる 少し脱線して、年ごとの論文数をまとめてみた 本題に入って、googletransによる論文情報の和訳とレポート作成をやってみる まとめ 全Rコード in gist 補足 MEDLINEタグ情報*5 Pu…
はじめに googletransライブラリのメリット・デメリット googletransのインストール reticulateのセットアップ RからPython googletransを呼び出す googletransの実行 まとめ 補足 Rから、Python ライブラリのヘルプ表示 googleLanguageRの「No authorizatio…
はじめに 実行環境 検証用のファイル生成 opensslコマンドを用いた、ランダム文字列の生成 echoとtrコマンドを用いた文字列の生成 seqコマンドを用いた連番数字の生成 seqコマンドを用いた検証用ファイルの生成 Rでのファイル読み込み検証 utils::read.table…
はじめに 前準備 適当な作業フォルダを作成して、同フォルダ内に移動する。 サンプルテキスト(text.txt)をGitHubからダウンロードする まず、test.txt ファイルの中を表示してみると grep コマンド の基本 まずは、ファイル内の文字列操作に関するコマンド…