Mac
rOpenSci (v. 0.6.9) によってレビューされたrtweetパッケージは、TwitterのRESTおよびストリームAPIを介して、Twitterのデータを収集・整理するために設計・実装された。 それを使用するためのR環境の初期設定については、 過去記事の「R/rtweetとか諸々を…
はじめに - AutoDock Vina AutoDockは、 30年近く開発が進められている、分子モデリングシミュレーションソフトウェアの一つです。 主に、タンパク質–リガンドのドッキングに利用されています。 2009年からオープンソース・ソフトウェアとなり、非商業的利用…
はじめに 今までほぼやってなかったけど、さっき使ってみて思いの外、便利でよかったです。 今後はこれを使いたいと強いメッセージを込めて、これのみでメモっておきます。 まずは、Macでエクセルを起動します。 文字や数字が書かれた、エクセルの任意のセル…
はじめに 「grepコマンドによる文字列処理をやってみた」の続編です。 以前扱えていなかった内容をやっていきたいです。 grepコマンドの基本については過去の記事を参照のこと。 skume.hatenablog.com まずは、サンプルデータをダウンロードする $ svn expor…
はじめに grepコマンドは、ある特定の文字列を含むものを取り出す・検索するときに使用します。 大別して、ファイル内のテキストに対してgrepを行うか、ファイル名に対してgrepを行うかでやり方が変わってきます。 やってることは単純だが、いろいろと応用で…
.bz2について bzip2では、 圧縮効率を良くするために、ブロックソート法などを用いています。 gzipやzipといったデータ圧縮に比べて、より高い圧縮率を示します。 また、bz2単独では、アーカイブ機能はありません。 Macでは、bzip2コマンドでbzip2圧縮、 bun…
はじめに(2022年1月アップデート版) Homebrewで、Python3をインストールする際の諸設定をまとめてみました。 この記事では、Anacondaを使わずに、 Homebrewでインストールして、ターミナル上から、Python3をPyhonコマンド、pip3をpipコマンドとして使うこ…
SRA Toolkitの設定 SRA Toolkitの設定は、以前の記事を参考のこと。 skume.net prefetchコマンドについて prefetchは、SRA(Sequence Read Archive)、dbGaP、ADSPデータのコマンドライン・ダウンロードを行うSRA Toolkit内のツールである。 prefetchコマンド…
はじめに 今回は、MacOSX環境で、SRA Toolkitのfastq-dumpを用いて取得した、 FASTQ形式ファイルをRに読み込む方法を扱う。 FASTQ形式ファイルの読み込みには、 Bioconductorパッケージの1つである、 ShortReadパッケージのreadFastq関数を用いる。 readFast…
Macで、フォルダごとファイルをアップロードしたときに、 一緒についてくる隠しファイルが邪魔と感じたことがあるのではないだろうか。 この記事では、シェル(sh)スクリプトのバッチ処理で、 DS_Storeとか、R関連の隠しファイルを削除するやり方を紹介する…
今回、やることは、タイトルの通りである。 パワポファイル(.pptx)は、ZIPファイルを解凍する要領で、 スライドに対応する XMLファイル、relsファイルや画像ファイルなどに分解して 各構成ファイルを確認することができる。 これは、パワポファイルがクラ…
はじめに R言語では、文字列をRの命令文として実行することができる。 このプログラム実行のやり方は、 「eval + parse + text + paste」型と表現されることがあるが、 実際には、eval関数、parse関数、paste関数を組み合わせて実行する。 使用する関数群の…
Mac版Rは、GUI(R.APP)とR frameworkから構成されている。 そのため、アンイストール時には、それらフォルダを削除する。 一般的なインストールの手順では、GUIは/Applications/R.appフォルダに、R frameworkは/Library/Frameworks/R.frameworkフォルダにイ…
R/Knitで、bibtexのリファレンスの処理ができなくなったと思ったら、pandocが消えてるっぽい。 Pandocというのは、文書作成ツール や出版作業時に用いられるドキュメント・コンバータの1つであり、、、、 なので、pandocを再度インストールしてみた。 pando…
はじめに Amazon Web Services(AWS)とは、 Amazon.comにより提供されているクラウドコンピューティングサービスである。 今回、AWSサービスを管理するための統合ツールである、 AWS CLIのインストールとかセットアップについてまとめてみた。 まずは、ター…
隠しファイル表示の概要 Macのショートカットで、隠しファイル( . から始まるファイルやフォルダ)の表示・非表示を切り替えることができる。 Finderで表示したいフォルダを選択して、 ⌘(コマンド) + Shift + . (ドット) を同時に押すと、隠しファイルが表…
今回は、Karhunen-Loève変換(KL変換)という手法を使って、 ヒマワリ画像の圧縮を行ってみた*1。 この手法のデフォルトでは、 主成分分析(PCA; Principal Component Analysis)をクロップ画像に適用することで、一度、画像を主成分ベクトルに変換する。 その後…
はじめに 今回は、EBImageとimagerを使った、 R環境での画像処理をいろいろと紹介する。 具体的に、画像ファイルの読み込み・表示、 ヒストグラム表示、グレー画像変換、リサイズ(縮小)とかのプログラムを作成・実行してみた。 はじめに、EBImageとimagerを…
はじめに twitterのつぶやきを集めて、形態素分析 + 感情分析をやってみた。 つぶやきの感情分析は、単語感情極性対応表を使って、positiveかnegativeかを評価してみた。やってみると、案外、面白かった。 まずは、Rの関連パッケージをインストールしてみる…
LINUX/Macのコマンドライン入門を目指したポストです。 lsコマンド(list segments)は、ディレクトリにあるファイルやフォルダの名前を表示するUNIXコマンドである。 今回は、代表的なオプションの使い方をまとめてみた。 あと、MacOSXでは動作確認をしている…
OneTab は、ブラウザで開いている沢山のタブをワンクリックでリスト化、 またはリストを復元・共有できてしまう神的ツールである。 日頃から、沢山のタブを開いたままにして、ブラウザが重くて仕方ないという状況には効果テキメンである。 OneTab自体はGoogl…
今回は、コンピュータ上の重複ファイルを検索するツール「dupeguru」の紹介記事である。 ファイル名またはコンテンツのいずれかをスキャンして、 重複したファイルを見つけて削除することができる。 コンテンツのスキャンでは、kbオーダーでのサイズ差分を検…
今回は、ターミナル・タスクマネージャーであるhtopの紹介記事である。 htopのインストール MacOSXとCentOSでのCUIインストール方法は、 ターミナルを起動して、以下のコマンドを打つだけである。 #MacOSXの場合 brew install htop #CentOSの場合 yum instal…
はじめに OSをクリーンインストールすると、色々と消えてて面倒である。 本記事は、消えたその1つである、MacTexをインストールした時の話である。 Homebrewをインストールして、ターミナルで以下を実行する。 skume.net brew update brew install mactex #…
Devel版R(あるいは、R-devel)は、 パッケージ開発者用に配布されていて、 最新(安定版)の次のRバージョンである。 Bioconductorのページを参考にして、 Devel版RのDockerイメージを使ってみたので、その方法をメモしておく。 bioconductor.org Mac版 Docke…
はじめに RでのWebスクレイピングのやり方の1つとして、rvestパッケージを使う方法がある。 詳細は、過去の記事を参照 skume.net skume.net ただ、このパッケージだと、Webスクレイピングがやや難解なケースがある。 実際、Google検索のヒット件数項目を取…
RのSlack APIであるslackrパッケージの使い方について、いろいろとまとめてみた*1。 APIの諸設定、基本的なslackrの使い方に加えて、新着論文情報をRからチャネルに送信するプログラムも実装してみた。 まずは、Salck API設定の手順からはじめよう。 Salck A…
この記事の内容を実行してしまったばっかりに、 Mac PCのクリーンアップ(初期化)を余儀なくされても、 一切保証できるものではありませんので、あしからず。 先日、.DS_Storeファイルが無性に邪魔に感じて、 Mac内にある同ファイルすべてを消してみたのだ…
PyMOLは、オープンソースの分子グラフィックスツールである。 いまも、教育版(Educational-use-only PyMOL)は、以下のフォームで登録すれば、フリーで使用できるらしい。 pymol.org 少し前にまとめた資料であるが、PyMolコマンドのメモとしてアップしてお…
シングルバイト文字・マルチバイト文字 「シングルバイト文字」は、1バイト(7ビット、または8ビット)のデータ量で表現できる文字である。文字コードとしては、ASCIIコードなどが該当する。 一方、ダブルバイト文字は、1文字を2バイト以上(16ビット以上…