京橋のバイオインフォマティシャンの日常

データ分析、コマンドライン、プログラミングについての技術資料・自己アップデート・悩み事などをまとめています。最近、ディープラーニング関連のR言語の資料をまとめるべく注力してます。

R言語

【Rのジミ〜な小技シリーズ】エクセルデータをクリップボードにコピーして、Rのread.table関数でデータフレームとして読み込むTips

はじめに 今までほぼやってなかったけど、さっき使ってみて思いの外、便利でよかったです。 今後はこれを使いたいと強いメッセージを込めて、これのみでメモっておきます。 まずは、Macでエクセルを起動します。 文字や数字が書かれた、エクセルの任意のセル…

R言語/Webスクレイピングで、Wikipediaページのテーブル情報からNASDAQ-100の銘柄リストを取得して、2021年中の株価推移を見てみた件

はじめに R言語を利用して、 Wikipediaページから銘柄コード情報を「Webスクレイピング」で取得して、 さらに各銘柄の株価情報を「quantmod パッケージ」を使って収集する。 今回の記事では、2021年年初から12月末までのNASDAQ-100銘柄(2022年1月3日現在)…

Rで、デフォルトパッケージ以外のパッケージを削除するTips

はじめに Rのデフォルトパッケージを残して、 追加でインストールしたパッケージだけを削除する方法をメモしておく。 パッケージがいろいろと増えてくると、 パッケージすべてを削除したいとか、 1つのパッケージだけを削除したいといったことを考え出す。 …

R言語/rstudio 初心者におすすめ入門本・参考書: 厳選 5 選!【2022年1月版】

はじめに R言語の公式ホームページ(https://www.r-project.org/) R言語は、統計解析やグラフィクス(データの可視化)に適した命令システムを持つ、インタープリタ型のプログラム言語です。 インタープリタ型は、Python言語やPerl言語などとも同じ方式で、…

R/ShortReadパッケージを使って、FASTQ形式ファイルを読み込む

はじめに 今回は、MacOSX環境で、SRA Toolkitのfastq-dumpを用いて取得した、 FASTQ形式ファイルをRに読み込む方法を扱う。 FASTQ形式ファイルの読み込みには、 Bioconductorパッケージの1つである、 ShortReadパッケージのreadFastq関数を用いる。 readFast…

R/Keras/TensorFlowでやる『ディープラーニング(Deep Learning)』のすゝめ【その3】敵対的生成ネットワーク (GAN)による教師なし画像生成(image generation)をやってみた件

「敵対的生成ネットワーク(GAN: Generative Adversarial Networks)」は、 ディープラーニングの生成モデルの一種であり、 与えたデータから本物と偽物を見分けるように複数の学習器を用いて学習することで、 新たな画像の生成や画風の変更などができる。 …

【R言語での画像処理シリーズ(その2)】主成分分析(PCA)を用いて、画像特徴の次元圧縮をやってみた件

今回は、Karhunen-Loève変換(KL変換)という手法を使って、 ヒマワリ画像の圧縮を行ってみた*1。 この手法のデフォルトでは、 主成分分析(PCA; Principal Component Analysis)をクロップ画像に適用することで、一度、画像を主成分ベクトルに変換する。 その後…

【R言語での画像処理シリーズ(その1)】R/EBImageとかを使った画像処理(読み込み、表示、リサイズetc)をやってみた件

はじめに 今回は、EBImageとimagerを使った、 R環境での画像処理をいろいろと紹介する。 具体的に、画像ファイルの読み込み・表示、 ヒストグラム表示、グレー画像変換、リサイズ(縮小)とかのプログラムを作成・実行してみた。 はじめに、EBImageとimagerを…

R/rtweetとか諸々を使って、つぶやきのテキスト解析 (形態素分析 + 感情分析) をやってみた件

はじめに twitterのつぶやきを集めて、形態素分析 + 感情分析をやってみた。 つぶやきの感情分析は、単語感情極性対応表を使って、positiveかnegativeかを評価してみた。やってみると、案外、面白かった。 まずは、Rの関連パッケージをインストールしてみる…

R言語で使用できるデータセット一覧 〜 R package ‘datasets’ version 4.1.0 〜

データセット一覧 2021年4月現在、R言語で使用できるデータセット一覧をまとめてみた。 概要の和訳部分は、DeepLにて機械翻訳した。 # ToothGrowth の使用例 libary(datasets) data(ToothGrowth) head(ToothGrowth) # len supp dose #1 4.2 VC 0.5 #2 11.5 …