R - readr
Rでの、文字列の抽出/切り出し、検出について、いろいろと試してまとめてみた。 主に、baseやstringrのパッケージを扱った。 関連パッケージをロードする library(stringr) library(readr) 文字列の抽出/切り出しについて stringr::str_extract関数、stringr…
Rでの文字列処理について、いろいろと試してまとめてみた。 このシリーズでは、主に、baseやstringr、stringdistとかのパッケージを扱う。 今回は、文字列距離を使って、近似的文字列をマッティングする方法を紹介する。 下準備について ###################…
テキスト解析で考慮すべき13のポイント【随時更新予定】 No 大項目 小項目 DB / Tools 備考 1 タスク選定 テキストマイニング / 固有表現認識 (NER) / その他 2 言語 英語 / 日本語 / (機械)翻訳された文章 / その他 機械翻訳: Python/Googletrans, DeepL …
はじめに 今回、Rでの文字列の検出について、いろいろと試してみた。 主に、base、stringrのパッケージを扱う。 Rでの文字列処理に関する過去記事 skume.net skume.net (adsbygoogle = window.adsbygoogle || []).push({}); 下準備について ################…
はじめに Rでの文字列ベクトルの連結とカウントについて、いろいろと試してまとめてみました。 主に、baseやstringrとかのパッケージ内の関数群を扱います。 文字列の連結・結合は普段もよく使うので簡単と思ってたけど、いろいろと試してみると奥が深いかも…
Rでのテキストファイルの読み込み、および文字列の分割について、いろいろと試してまとめてみた。 主に、baseやstringrとかのパッケージ内の関数群を扱う。 結論としては、ファイル読み込み関数は用途によって使い分けが必要である。また、文字列の分割につ…
はじめに 最近、数GBを超えるテキストデータを扱うようになり、今更ながら、Rのファイル読み込み関数の速度比較について一度検討してみた。 今回、以下の3つのファイル読み込み関数について調査してみた。 utils::read.table関数 data.table::fread関数 rea…