2022-01-01から1年間の記事一覧
はじめに データサイエンス・データコンサルのおすすめ書籍 イシューからはじめよ ― 知的生産の「シンプルな本質」 シン・ニホン AI×データ時代における日本の再生と人材育成 マーケティングリサーチとデータ分析の基本 コンサル一年目が学ぶこと まとめ は…
はじめに: 『R環境で小説のテキストマイニング』の連載シリーズです。 連載シリーズの目次 実行環境 名詞、接頭辞、接尾辞をくっつける、品詞のルールベースの複合語抽出 pytermextractを使った複合語抽出 ターミナル環境上での、pytermextractを使った複合…
はじめに: 『R環境で小説のテキストマイニング』の連載シリーズです。 連載シリーズの目次 実行環境 形態素解析と辞書設定 mecabを使った形態素解析 MeCabの辞書設定 辞書による形態素解析結果の違い デフォルトのipadic辞書を使った場合 neologd辞書を使っ…
はじめに 連載シリーズの目次 実行環境 1. 青空文庫、対象小説の紹介 夏目 漱石が執筆した小説の無料公開リスト 2. 「坊っちゃん」のテキストの前処理 処理したテキストの保存 まとめ テキスト処理の関連記事 参考資料 はじめに テキストマイニングは、簡単…
はじめに FLASHの原著論文 今回のzsh実行環境 M1 Macにおけるflash2のインストール flash2によるペアエンドfastqのマージ実行 GAGEからペアエンドのfastqデータを取得する まとめ ゲノム解析の関連記事 参考資料 補足 FASTQ形式からFASTA形式への変換 - sed…
はじめに パーマー群島(南極大陸)のペンギンさんのデータを活用する hclust関数での階層的クラスタリング ウォード法(ward.D)を使用する場合 "ward.D" method + データフレームの転置 ウォードD2法(ward.D2)を使用する場合 最近隣法(single)を使用する場合…
雑談 2022年残りのTo Do 雑談 相変わらず、夕暮れと共に、京橋界隈を徘徊しています。飲み屋の客引き、お姉さんらに、もう顔を覚えられてるというレベルです。バイオインフォの香りよりも、酒の香りが漂っている、大阪・京橋。 先日、コロナ禍中行けなかった…
はじめに rtweetパッケージのインストール テキストをつぶやく 画像をつぶやく まとめ 補足 全てのフレンドのフォローを辞めるTips 闇を消そう、、Twitterのポストを全削除するTips 闇からの開放企画: ユーザーが行った「いいね」をすべて削除するTips rtwee…
はじめに - AutoDock Vina 原著論文 - AutoDock Vina - 今回やること セットアップ brewの設定 brewコマンドを用いたパッケージのセットアップ Autodock Vina 1.2.2のセットアップ AutoDock Vinaのチュートリアル「basic_docking」を実行してみる 実行時のコ…
はじめに データフレームの列名を追加する 文字列の変数で、データフレームの列名を追加する はじめに pasteなどで連結して作成した文字列をもとにして、それらをデータフレームの列名にしたい。 そういうケースがよくあるのです。 食わず嫌い的に試して無か…
エクセルデータをクリップボードにコピーしてR環境に読み込む コピーしたセルがヘッダーを含む場合 コピーしたセルがヘッダーを含まない場合 追記(2020年6月10日): マークダウンなどでテーブル出力 【Rのジミ〜な小技シリーズ】 参考資料 エクセルデータを…
はじめに まずは、サンプルデータをダウンロードする 検索語に一致した文字列のみを抜き出して出力する 大文字・小文字を区別せず、検索語に一致した文字列のみを抜き出して出力する 検索語に一致した文字列の数をカウントする【部分一致検索】 検索語に一致…
はじめに 練習用のファイルのダウンロード ファイル内のテキストに対する処理 ある特定の文字列を含む行を表示する ある特定の文字列を含まない行を表示する ある特定の文字列を含まない行を別ファイルに出力する 空白行を削除する ファイル内の行数をカウン…
はじめに とりあえず、結果 表示結果 Leaflet Dygraphs networkD3 d3heatmap DataTables MetricsGraphics まとめ はじめに htmlwidgets for R パッケージは、Rでインタラクティブな図が作成できる王道的なパッケージであり、 それを使った色々な依存パッケー…
.bz2について bzip2コマンドによるbzip2圧縮 bzip2圧縮を行い、任意のファイル名で保存する場合 bunzip2コマンドによるbzip2解凍 .tar.bz2について tarコマンドによるtar.bz2圧縮 tarコマンドによるtar.bz2解凍 .bz2について bzip2では、 圧縮効率を良くする…
はじめに R/Kerasのセットアップ MNISTデータの準備 Autoencoder with 2D CNN のモデル構築 ちょっとした関数の説明 DLモデルの出力 結果の評価 色ムラに対するDenoising Autoencoder 色ムラがある手書き文字の生成 Autoencoder for denoising モデルの構築 …
はじめに(2022年1月アップデート版) Homebrew でPython3をインストールする。 実行環境 Homebrew で、Python3 をインストールする Pythonパスを確認する 次にやること・・・パスの優先度の変更 /opt/homebrew/binのエイリアス名を変える まとめ Python …
はじめに NASDAQ-100のWikipediaページ、Rでの下準備 NASDAQ-100 使用するパッケージの事前準備 Wikipediaページからの銘柄リストの取得 NASDAQ-100 NASDAQ-100銘柄の年間パフォーマンスをアニメーションにする 1年間のパフォーマンス ツリーマップのアニメ…
特定パッケージだけを削除する方法 R環境での実行例 補足: 他の関数群 特定パッケージだけを削除する方法 Rのデフォルトパッケージを残して、 追加でインストールしたパッケージだけを削除する方法をメモしておく。 パッケージがいろいろと増えてくると、 パ…
SRA Toolkitの設定 fasterq-dumpコマンドで、FASTQファイルを高速に取得する fasterq-dumpの基本形 複数のSRAオブジェクトに対する、fasterq-dumpの実行 fasterq-dumpのオプション 補足 single-endか、paired-endの判定プログラム fastq-dumpコマンドとの相…
はじめに R言語のおすすめ入門本 5 選 + アルファを紹介!! 改訂2版 RユーザのためのRStudio[実践]入門〜tidyverseによるモダンな分析フローの世界 R言語ではじめるプログラミングとデータ分析 Rでらくらくデータ分析入門 ~効率的なデータ加工のための基礎…
SRA Toolkitの設定 prefetchコマンドについて prefetchの基本形 prefetchの代表的なオプション 複数のSRAファイルを一度にダウンロードする 補足 シェルスクリプトで、複数のFASTA形式ファイル(+ gz圧縮)をダウンロードする。 ゲノム解析の関連記事 参考資…
はじめに 関連パッケージの読み込み SRA Toolkit / fastq-dump コマンドを使って、FASTQファイルを取得する。 FASTQファイルの読み込み リード長を取り出す方法 クオリティスコアを可視化する サイクルごとにクオリティスコアを可視化する まとめ ゲノム解析…
はじめに Pathophysiology / 病態生理 過去の記事 はじめに この記事は、2021年12月30日現在のWikipedia 英語記事「COVID-19」を日本語訳したものである。 en.wikipedia.org この情報は英語ページにはありますが、まだ日本語ページは存在していません。結構…
はじめに Transmission / 伝染 その3に続く はじめに この記事は、2021年12月30日現在のWikipedia 英語記事「COVID-19」を日本語訳したものである。 en.wikipedia.org この情報は英語ページにはありますが、まだ日本語ページは存在していません。結構しっか…