京橋のバイオインフォマティシャンの日常

南国のビーチパラソルの下で、Rプログラムを打ってる日常を求めて、、Daily Life of Bioinformatician in Kyobashi of Osaka

2022-07-01から1ヶ月間の記事一覧

Mac版wgetコマンドのプログレス・ログ詳細を表示させないTips

はじめに - 問題提起 Googleドライブからのファイルダウンロード デフォルトログ表示への対策 R言語でのwget実行 参考資料 はじめに - 問題提起 wgetコマンドを使ってたら、そのデフォルトログが冗長で嫌になりませんか?? 今回の記事では、その対策として…

【R言語/速度論/数値計算】10倍量のヨーグルトを作りながら、乳酸菌の増殖曲線を考えてみた件

この記事は、2020年6月13日記事のアップデート版です。 はじめに 方法 (1): 10倍量ヨーグルト作製のマテリアル 方法 (2): 10倍量ヨーグルトの作製プロトコール 結果: 種菌の増殖曲線の検討 まとめ 参考文献 はじめに 最近、ヨーグルト作りにハマっていま…

【特集】AIプログラミング学習サービス、無料講座 & 無料カウンセリング受講

今後、日本で深刻化するAI人材不足 AIプログラミングの要「Python」の人気が止まらない!! 保有スキルランキングで人気上昇中、Pythonエンジニアの平均年収は? 無料講座や無料カウンセリング 初心者からAIエンジニアへ!オンラインAIプログラミングスクー…

データサイエンスを活用したビジネス戦略・データコンサルの厳選書籍

はじめに データサイエンス・データコンサルのおすすめ書籍 イシューからはじめよ ― 知的生産の「シンプルな本質」 シン・ニホン AI×データ時代における日本の再生と人材育成 マーケティングリサーチとデータ分析の基本 コンサル一年目が学ぶこと まとめ は…

R環境で小説のテキストマイニングをやってみたら、○○○な結末になった件【その3: 形態素解析と複合語抽出 (名詞、接頭辞、接尾辞の品詞ルールベース抽出、pytermextract)】

はじめに: 『R環境で小説のテキストマイニング』の連載シリーズです。 連載シリーズの目次 実行環境 名詞、接頭辞、接尾辞をくっつける、品詞のルールベースの複合語抽出 pytermextractを使った複合語抽出 ターミナル環境上での、pytermextractを使った複合…

R環境で小説のテキストマイニングをやってみたら、○○○な結末になった件【その2: 形態素解析と辞書設定】

はじめに: 『R環境で小説のテキストマイニング』の連載シリーズです。 連載シリーズの目次 実行環境 形態素解析と辞書設定 mecabを使った形態素解析 MeCabの辞書設定 辞書による形態素解析結果の違い デフォルトのipadic辞書を使った場合 neologd辞書を使っ…

R環境で小説のテキストマイニングをやってみたら、○○○な結末になった件【その1: 夏目漱石の小説「坊っちゃん」を使った、テキストの前処理編】

はじめに 連載シリーズの目次 実行環境 1. 青空文庫、対象小説の紹介 夏目 漱石が執筆した小説の無料公開リスト 2. 「坊っちゃん」のテキストの前処理 処理したテキストの保存 まとめ テキスト処理の関連記事 参考資料 はじめに テキストマイニングは、簡単…

M1 Mac環境で、flash2を使ってペアエンドfastqをマージしてみた件

はじめに FLASHの原著論文 今回のzsh実行環境 M1 Macにおけるflash2のインストール flash2によるペアエンドfastqのマージ実行 GAGEからペアエンドのfastqデータを取得する まとめ ゲノム解析の関連記事 参考資料 補足 FASTQ形式からFASTA形式への変換 - sed…

R言語でのデンドログラム(樹形図)と階層的クラスタリングの諸事【hclustとheatmap.2での階層的クラスタリング】

はじめに パーマー群島(南極大陸)のペンギンさんのデータを活用する hclust関数での階層的クラスタリング ウォード法(ward.D)を使用する場合 "ward.D" method + データフレームの転置 ウォードD2法(ward.D2)を使用する場合 最近隣法(single)を使用する場合…