『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day
統計処理言語の R のバージョン3.1.0が、2014年4月10日に公開された。この新リリースでの主な変更点について解説する。 バージョン3.1.0のリリース 2014年4月10日、R のバージョン3.1.0がリリースされた。コードネームは Spring Dance(春の踊り)である。バージョン3.0.0がリリースされたのは、2013年4月3日なので、およそ1年を経てマイナーバージョンアップが行われたことになる ((なお、バージョン3.0.0と3.1.0との間に3回のリビジョンが行われている。すなわち、2013年5月16日にバージョン3.0.1が、9月25日にバージョン3.0.2が、2014年3月6日にバージョン3.0.3がそれぞれリリースされている。)) 。 Rのバージョン3.1.0のコードネームは Spring Dance(春の踊り)である。 ((Pixabay にて公開されている S
最近、傾向スコア分析を再勉強している。 非常におおざっぱに言えば、無作為割り当てが不可能な調査観察データにおいて、擬似的に無作為割り当て状況を作り出す手法。 もう少し噛み砕いて言えば、「似たもの同士」を探してそのペアを比較する手法と言えばわかりやすいだろうか。このように、分析の中心的な考え方は「ペアの比較」なので分析レベルではかなりシンプルな手法だが、どのような基準で「似たもの同士」を定義するか(「マッチング」と呼ばれる)がけっこう複雑。 じじつ、数年前、『調査観察データの因果推論』(下記)を読んだときはほとんど理解できなかった。 調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学) 作者: 星野崇宏出版社/メーカー: 岩波書店発売日: 2009/07/29メディア: 単行本購入: 29人 クリック: 285回この商品を含むブログ (26件) を見る
Rのインストール R(アール)は統計・データ解析・統計グラフ作成のためのオープンソースソフトです。CRAN(「シーラン」または「クラン」、Comprehensive R Archive Network)のミラーサイト(例えば https://cloud.r-project.org など)からダウンロードし、インストールしてください。Windows用、Mac用、Linux用があります。 最近では下図のような RStudio(アール・スタジオ、英語の発音により忠実に書けばアール・ステューディオまたはアール・ストゥーディオ)という統合開発環境(IDE)を介してRを使う人が増えています。Download RStudio Desktop のページからダウンロードしてインストールします。 RStudio。左上ペインがソースエディタ(この図では隠れている)、左下がRコンソール、右上がグローバル環境のオブ
(※※※続編記事書きました→「使い分け」ではなく「妥当かどうか」が大事:重回帰分析&一般化線形モデル選択まわりの再まとめ) 今ちょうどadtech tokyo 2013の会期中で、職場からも近い&会社から行ってこいという指示が出たということで僕も色々セッションを聞いたり企業ブースのお話を聞いたりしてる*1ところです。 ところで、いくつかのセッションの中でキーワードとして「重回帰分析」という言葉が出てきてました。ま、それ自体はこのブログでもRによるデータ分析絡みで頻出だし、ぶっちゃけありふれた手法と言って良いでしょう。やりようによっては普通にExcelでもできますし、それだけ人口に膾炙していると言って良いのかもですね。 ただし。意外にも内部のパラメータというか細かい手法の分岐というか、それこそ普通の線形モデルvs.一般化線形モデル(バリエーション多数)があることを無視して漫然と重回帰分析をや
CRANパッケージ{MSwM}の大体の使い方が分かったので簡単に共有します。 なお、しつこいようですがマルコフ状態転換モデルについてはこのブログではすっかりお馴染みの以下のテキストをご参照のこと*1。僕もまだ勉強中です。 経済・ファイナンスデータの計量時系列分析 (統計ライブラリー) 作者: 沖本竜義出版社/メーカー: 朝倉書店発売日: 2010/02/01メディア: 単行本購入: 4人 クリック: 101回この商品を含むブログ (4件) を見る Time Series Analysis 作者: James D. Hamilton出版社/メーカー: Princeton Univ Pr発売日: 1994/01/11メディア: ハードカバー購入: 1人 クリック: 5回この商品を含むブログ (7件) を見る なお、沖本テキストでは簡単な説明のみに留められているので、Hamiltonテキストの方
追記 2016年3月に以下の記事によってこの内容はupdateされています。今後はそちらをお読み下さい。 主に自分向けのまとめという意味合いが強いんですが(笑)、僕が実際に2013年6月現在webデータ分析&データサイエンスの実務でツール・ライブラリ・パッケージを利用しているものに限って、統計学・機械学習系の分析手法を10個挙げて紹介してみようと思います。 追記 回帰分析(特に線形重回帰分析) 独立性の検定(カイ二乗検定・フィッシャーの正確確率検定) 主成分分析(PCA) / 因子分析 クラスタリング 決定木 / 回帰木 サポートベクターマシン(SVM) ロジスティック回帰 ランダムフォレスト アソシエーション分析(バスケット分析・相関ルール抽出) 計量時系列分析 おわりに おまけ1:「素性ベクトル+分類ラベル」なるデータ前処理 おまけ2:グラフ理論*10 {igraph}パッケージでグラ
4月3日、オープンソースの統計解析ツール「R」開発チームは最新版となる「R 3.0.0」(開発コード「Masked Marvel」)のリリースを発表した。2^31-1以上の要素を持つベクトル(Long Vector)のサポートなどが加わっている。 Rは統計や解析処理、グラフ化のための言語および実行環境。WindowsやMac OS X、Linuxなどで利用できる。GNU Projectの1つで、動的型付け、オブジェクト指向などの特徴を持ち、データの操作、計算、グラフィック表示などの機能も統合されている。拡張性が高く、関連パッケージが豊富に用意されている点も特徴で、パッケージはCRAN(Comprehensive R Archive Network)から入手できる。ライセンスはGPL。 バージョン3.0.0は、2004年に公開されたR 2.0.0以来のメジャーバージョンとなる。大きな変更点と
4月10日追記。開発者の今尾さんご自身が MacR のダウンロードサイトを用意してくださったので、そちらのリンクを紹介します。インストール方法等の説明はありませんので当ブログエントリーは残しておきますが、ファイル自体はこちらからダウンロードしてください。 MacR ダウンロードサイト https://sites.google.com/site/casualmacr/ 2月23日のLET関西支部メソドロジー研究部会で正式に発表された MacR は、オープンソースの統計解析ソフト R に GUI を装備し、ドラッグ・アンド・ドロップなどを使いながら直感的に統計処理を行うことを目指した Mac OS X 専用のアプリケーションです。 製作者の今尾康裕さん(大阪大学)による正式なサイトが未完成で、マニュアルやチュートリアル的なものも未整備なため、とりあえずインストールをして使えるようになるまでの手
元ネタのブログは「10 R packages every data scientist should know about」と「10 R packages I wish I knew about earlier」です。紹介されているパッケージはどれも良いのでメモしておきます。私が「取得した方がいいだろうなー」と思う順番に並べ替えてます。サンプルコードは後者の記事に載ってます。 randomForest:超強力な汎用予測モデル RPostgreSQL, RMYSQL, RMongo, RODBC, RSQLite:各種データベースへの接続 plyr:データ集約 reshape2:データ加工 forecast:時系列予測 stringr:文字列操作 lubridate:日付操作 sqldf:SQLライクなデータ操作 ggplot2:綺麗なプロットを描く qcc:品質管理 個人的には、下の3つは
昨今、ビッグデータというキーワード、およびその関連技術は非常に注目を集めており「R言語」というフレーズを耳にする機会も多くなってきたように感じます。 本稿は利用例を通じてR言語の概要、イメージを掴んでいただくことに加え、R言語を取り巻く業界の動向についてご紹介することを目的としています。 利用例としては、私がとあるシステム運用において実施していた分析を簡略化した形でご紹介します。システム統計情報に対する分析事例なので、ITシステムの設計や運用に携わる方であれば目にすることの多い、なじみ深いデータ分析と言えるのではないでしょうか。 なお、本稿では統計についての数学的な解説は極力行わず、R言語の利用者目線でのご紹介に重点を置きます。 対象読者としては、 などを想定しています。 また、Rは統計的なデータ処理を行うCUIベースのプラットフォームであり、CUI操作、スクリプト言語の経験、統計学に対す
This document discusses analyzing Twitter data from the user @a_bicky using R. It extracts over 3,200 tweets from the user's timeline using the twitteR package. The tweets are transformed into a data frame with variables like text, date, and source. The data is then summarized using the reshape2 and ggplot2 packages to calculate metrics like average text length by day of week, month, and source. F
R 環境を終了させたいときは、コマンドラインに q() と打てば終了できます。q() は quit() の省略形で、このままだと Save workspace image? [y/n/c]: などと聞かれるので、それがうっとおしい人は q("no") のように打てば確認されずに終了できます。 しかし、R を終了させるために 7 文字も打つのはめんどくさいと言う人たちがいます。 そういう人たちのために、 Q と打つだけで終了できるようにするテクニックがあります。 どういうテクニックかちょっとおさらいしておきましょう。*1 Q で R を終了させるテクニック まず、コマンドラインに x <- 3.14 x と打つと [1] 3.14 と表示されますね。 ここで、2行目の x は暗黙のうちに print(x) を呼び出していることを思い出してください。 print() は内部で UseMetho
この Web ページでは,R を用いた主成分分析のための操作手順の一例を図解で説明します ここでは,R の princomp() 関数を使います. 【補足】princomp() 関数では,特に指定しない限り, 不偏分散共分散行列 あるいは 不偏相関係数行列 が使われます (このことは R の princomp() 関数のマニュアルに書いてあります). あらかじめ決めておく事項 主成分分析を行う CSV ファイル名と属性名を決めておいてください. この Web ページでは,次のように書きます. 散布図を作成する CSV ファイル名: C:\R\Book1.csv 属性名:seq, date, USD, EUR, AUD 属性名は英語になっていること.CSV ファイルの第一行目に書いていること(そうなっているものとして,手順を書きます). 必要となるソフトウエア R のインストール が済んでい
数値化できることは数値化したほうがよい。-ホグネス このページでは、フリーの統計ソフトR(アール)を使って共焦点顕微鏡の画像データ(Zeiss社のlsm形式)を解析する。 Rは、無料、高機能、プログラミングが容易、プラットフォームフリー、日本語のドキュメントが豊富、などの利点をもつ(詳しくはここ)。 Rで画像解析を行うと、画像の読み込みから統計処理・グラフの出力までを自動化できて便利である。 FRAPデータの解析、分子の軸索内局在の解析、小胞輸送の解析、拡散障壁のシミュレーションについて記録する。 必要に迫られたプログラミング初心者の備忘録。 Image gallery 2.1 lsmはバイナリ 2.2 lsmの仕様書 2.3 image directoryとは 2.4 directory entryとは 2.5 画像のピクセルデータ 2.6 lsm特有
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く