[B! algorithm] TAKESAKOのブックマーク

TAKESAKO id:TAKESAKO

algorithmに関するTAKESAKOのブックマーク (65)

「最強最速」を見せつけた浪速の高専生
高専生にとっての大イベント、「高専プロコン」の季節がまたやってきた。競技部門では、大人をもうならせる良問に、優れたアルゴリズムを携えてしのぎを削る学生たちの姿があった。秋晴れに包まれた10月17日、18日にかけて、千葉県木更津市にある「かずさアカデミアホール」にて、「全国高等専門学校第20回プログラミングコンテスト」（高専プロコン）が開催された。高等専門学校の学生を対象とした情報処理技術系コンテストといえば「高専ロボコン」が特に有名だが、1990年にはじまった高専プロコンも歴史を重ね、いまでは高専ロボコンとの二枚看板の様相を呈している。大きな節目となる20回目を迎えた今回の高専プロコンのテーマは「集まれ手作りの未来たち――海を越え！翔けろ！橋になれ！――」。課題、自由、競技と3部門が設けられている同大会だが、競技部門はほかの部門と比べてエンターテインメント性を強く押し出し、メディア
TAKESAKO 2009/10/20
＞競技部門を制した大阪府立工業高専の3人（左から岩見宏明氏、浜田悠樹氏、藏内亮氏）。ほほに張り付いているのはIntelのステッカー。「Intelコンパイラがあればもっといい結果が出たかもしれない。Intelコンパイラほし

algorithm

procon2009

高専
リンク
「馬券の配当160億円」をどうやって実現したのか - 朝日新聞の補足記事 - アフター・パンデミック
ちまたの競馬予想会社のうさん臭さは、「そんなに儲かるならなぜ自分で買わない」という言葉で表されるが、ほんとに儲かる人間はやはり自分で馬券を買っていることを証明した事件だと言える。 asahi.com（朝日新聞）が競馬の配当１６０億円隠す　英国人社長のデータ分析会社という記事を報じているが、新聞紙面ではその隣に関連記事も掲載されているので、これを引用する。「なぜそんなに稼げた - 3連単を分散買い」（2009年10月9日付朝日新聞より）ユープロ関係者らによると、同社は、天候や出走馬の血統、騎手などの各データを入力、解析する競馬必勝プログラムを使い、高確率で配当金を得ていたという。だが、億単位の資金を使い、ほとんどの組み合わせの馬券を買うという、一般の競馬ファンにはまねできないやり方だった。 05年設立の同社が目をつけたのは、「3連単」という馬券。1着から3着までを順番通り当てるもので、配
TAKESAKO 2009/10/12
システムトレード？

これはすごい

algorithm
リンク
騒がしい未来 » Blog Archive » [SBM研究会]第3回ソーシャルブックマーク研究会　Ust 資料まとめ
ムチャクチャ面白いイベントでした。会場も浮世離れせず、使い回しのプレゼンもなく、ガチな感じが強くてよかったです。プレゼン資料置き場 http://homepage3.nifty.com/toremoro/study/SBM3.html ■プログラム 10:10-10:50 SBM研究会：エコメンデーション講師：佐々木祥 ,上村理(東京工業大学博士課程、修士課程) 11:10～11:50 SBMの推薦アルゴリズム～はてなブックマークのレコメンド（関連エントリ）の仕組み～岡野原大輔 PFI 特別研究員 13:00～13:15 SBMはミニブログです。：福冨諭（Webプログラマ） SBM研究会 13:15～13:45 SBMを利用したフィッシングサイト検知とその展望－集合知セキュリティという考え方－：中山心太(NTT研究所) 13:45～14:15 言語表現に基づくブックマ
TAKESAKO 2009/09/29
http://homepage3.nifty.com/toremoro/study/SBM3.html

sbm

algorithm
リンク
SBM研究会発表資料 - SBMの推薦アルゴリズム - DO++
先週末東工大で開催された第３回SBM研究会の発表資料です。 * SBMの推薦アルゴリズム [pdf] [pptx] - はてブの関連エントリで利用されているBayesian setsの解説とその改良（とチューニングちょっと） - Locality Sensitive Hash (LSH)の解説と実験結果．結構うまくいった (最初のエコは大切というのは前の発表からの流れです） ---- 研究会は熱心な人がたくさんいて、twitterでリアルタイムな反応がみれるなど新鮮でした。
TAKESAKO 2009/09/18
algorithm

機械学習
リンク
Regular Expression Matching Can Be Simple And Fast
Regular Expression Matching Can Be Simple And Fast (but is slow in Java, Perl, PHP, Python, Ruby, ...) Russ Cox rsc@swtch.com January 2007 Introduction This is a tale of two approaches to regular expression matching. One of them is in widespread use in the standard interpreters for many languages, including Perl. The other is used only in a few places, notably most implementations of awk and grep.
TAKESAKO 2009/09/18
regexp

正規表現

algorithm
リンク
Bayesian Setsを試してみた - のんびり読書日記
この前YAPC Asia 2009に参加してきたのですが、そこで「はてなブックマークのシステムについて」の発表の中で、「はてブの関連エントリはBayesian Setsを使って計算されている」という話を聞いてBayesian Setsに俄然興味が湧いてきました。Bayesian Setsは以前論文だけ少し読んで、あまりよく分からないまま放置していたのですが、せっかくなのでPerlで作って試してみました。 Bayesian Setsについて詳しくは、以下のリンク先の資料をご参照下さい。 Bayesian Setsの論文 Bayesian Setsの詳しい説明記事 bsets, The Bayesian Sets algorithm. (Matlabのコード) 実際に作成したコードは以下の通りです。上記のMatlabのコードを参考にさせていただいています。 #!/usr/bin/perl #
TAKESAKO 2009/09/18
yapcasia2009

algorithm

機械学習
リンク
YAPC::Asia 2009 1日目「Perlで圧縮」の資料 - naoyaのはてなダイアリー
1日目の発表を終えました。資料を公開します。 Perlで圧縮View more presentations from Naoya Ito. 発表の方は少し駆け足になってしまいました。明日ははてなブックマークのシステム事例の話をしたいと思います。発表の様子 via: http://yapcasia2009.ficia.com/
TAKESAKO 2009/09/11
yapcasia2009

perl

algorithm
リンク
Variable Byte Code と UTF-8、またはUTF-24が存在しないわけ : 404 Blog Not Found
2009年08月05日00:30 カテゴリLightweight Languages Variable Byte Code と UTF-8、またはUTF-24が存在しないわけ実は、これに非常に良く似た符号化を、我々は日々目にしています。 γ符号、δ符号、ゴロム符号による圧縮効果 - naoyaのはてなダイアリー通常の整数は 32 ビットは 4 バイトの固定長によるバイナリ符号ですが、小さな数字がたくさん出現し、大きな数字はほとんど出現しないという確率分布のもとでは無駄なビットが目立ちます。 UTF-8です。 UTF-8は、0x0から0x10FFFFまでの整数を、以下のようにしてバイト列に変換します。 Range/Offset0123 0x00-0x7F0xxxxxxx 0x80-0x3FF110xxxxx10xxxxxx 0x400-0xFFFF1110xxxx10xxxxxx10xx
TAKESAKO 2009/08/06
algorithm

dankogai

perl

unicode

utf-8
リンク
More C++ Idioms - Wikibooks
「C++ はあまりに『熟練者に優しく』なってしまった」(C++ has indeed become too "expert friendly") Stroustrup 氏の言は真実である。なぜなら熟練者は言語のイディオムに深く精通しているからである。プログラマが理解するイディオムの増加に従って、言語は彼あるいは彼女にとってよりフレンドリーになる。この open content book の目的はほどほどに C++ に精通しているプログラマに対して現代的な C++ のイディオムを提示し、C++ をよりずっとフレンドリーに感じるレベルにまで知識を引き上げる助けと成る事である。本書は熟練した C++ プログラマが C++ を使ってプログラミングや設計を行う際に用いる事の多い再利用可能なイディオムの網羅的なカタログと成るよう意図されている。これは、それらのテクニックや語彙をひとまとめにしようという
TAKESAKO 2009/07/27
c++

template

algorithm
リンク
Perl で Range Coder (再挑戦) - naoyaのはてなダイアリー
以前にも Perl で Range Coder を実装した (http://d.hatena.ne.jp/naoya/20080927/1222512024) のですが、当時は理解も曖昧なまま速度にも気を遣わずに実装していました。再度改めて、Range Coder を実装してみました。 http://github.com/naoya/perl-RangeCoder/tree/master README に記載した通り、静的 Range Coder*1、Binary Indexed Tree を用いた適応型 Range Coder、それからついでに 1-order の有限文脈モデルをもちいたものを作ってみました。いずれも Algorithms with Python の情報 (1, 2, 3)を参考に実装しています。 Canterbury Corpus の alice29.txt は 0-
TAKESAKO 2009/07/25
use Dynaloader; で x86 を直接実行するのが高速かなぁ

perl

algorithm
リンク
サービス終了のお知らせ
サービス終了のお知らせいつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。お客様がアクセスされたサービスは本日までにサービスを終了いたしました。今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。
TAKESAKO 2009/07/07
algorithm

rangecoder

python
リンク
C - でも一番右端の立っているビット位置を求めてみた : 404 Blog Not Found
2009年07月07日03:30 カテゴリMathLightweight Languages C - でも一番右端の立っているビット位置を求めてみた素晴らしい。 2009-07-04 - 当面C#と.NETな記録問題の説明はここまでにして、コードの紹介です。Hacker's delight のコードより4〜5倍速く、そして、イミフ加減が半端じゃない！これ一つで 64bit 値以下のすべての値に対応できます。でも、実際にどれくらい威力があるか試してみたかったのでCに移植してみた。意外な結果が出ております。 0x03F566ED27179461ULL まずは黒魔術。より黒魔術っぽくしてみました。 typedef unsigned long long U64; #define HASH 0x03F566ED27179461ULL static int ntzhash[64]; void i
TAKESAKO 2009/07/07
algorithm

binary

c

dankogai

x86
リンク
初級C言語Q&A(15)
初出: C MAGAZINE 1996年8月号 Updated: 1996-09-21 [←1つ前] [→1つ後] [↑質問一覧] [↑記事一覧] [ホームページ] 今回は、よく知られているけどちょっと分かりにくいアルゴリズム、あるいは、今までの連載で出てきたトリッキーなコードについて、どのような原理で動作するのかを紹介してみようと思います。ただし、一般論として、凝ったコードよりも分かりやすいコードの方が価値がある場合が多いということも頭に入れておいてください。凝ったアルゴリズムＱ　【曜日の求め方】 Comp.lang.c FAQ listを見ると、曜日を求める関数として次のものが紹介されていた。 dayofweek(y, m, d) /* 0 = Sunday */ int y, m, d; /* 1 <= m <= 12, y > 1752 or so */ { stat
TAKESAKO 2009/07/06
algorithm

c

binary
リンク
一番右端の立っているビット位置を求める「ものすごい」コード - 当面C#と.NETな記録
一番右端の立っているビット位置(RightMostBit)を求めるコードで速いのないかなーと探していたら、ものっっっすごいコードに出会ってしまったのでご紹介。2ch のビット演算スレで 32bit 値のコードに出会って衝撃を受けて、その後 64bit 値版のヒントを見つけたのでコードを書いてみました。この問題はハッカーのたのしみ―本物のプログラマはいかにして問題を解くか (Google book search で原著 Hacker's delight が読めたのでそれで済ませた) で number of trailing zeros (ntz) として紹介されています。bit で考えたときに右側に 0 がいくつあるかを数えるもの。1 だと 0、2 だと 1、0x80 なら 7、12 なら 2 といったぐあい。0 のときに表題どおりの問題として考えるといくつを返すの？ってことになるので、
TAKESAKO 2009/07/06
algorithm

c

binary
リンク
http://www.sabamiso.net/yoggy/tdiary/?date=20090618
TAKESAKO 2009/07/03
CTF

programming

algorithm
リンク
Web上の膨大な画像に基づく自動画像補完技術の威力 - A Successful Failure
画像内に映り込んだ所望のオブジェクトを排除し、違和感の無い画像を生成するシーン補完技術に関しては近年複数の研究成果が発表されている。しかし中でも2007年のSIGGRAPHにて米カーネギメロン大のJames HaysとAlexei A. Efrosが発表した手法*1はブレークスルーとなりうる画期的なものだ。論より証拠、早速適用例を見てみよう。本エントリで利用する画像はPresentationからの引用である。元画像の中から邪魔なオブジェクト等の隠蔽すべき領域を指定すると、その領域が補完された画像が自動的に生成される。アルゴリズム効果は抜群だがアイデア自体は単純なものだ。Web上には莫大な数量の画像がアップされており、今や対象となる画像の類似画像を一瞬にして大量に検索することができる。そこで、検索された類似画像で隠蔽領域を完全に置き換えてしまうことで違和感の無い補完画像を生成するのだ。
TAKESAKO 2009/07/02
これはすごい

algorithm

image

photo
リンク
Expired
Expired：掲載期限切れですこの記事は，ダウ・ジョーンズ・ジャパンとの契約の掲載期限（90日間）を過ぎましたので本サーバから削除しました。このページは20秒後にNews トップページに自動的に切り替わります。
TAKESAKO 2009/05/25
google

algorithm

IT
リンク
データベースの動的デフラグ - mixi engineer blog
ノートPCの冷却ファンがうるさいのを対処しようとしてWebで調べたら、そのファンの設計者が「静音性へのこだわり」を語ったページにたどり着いて複雑な心境のmikioです。今回は、Tokyo Cabinet（TC）の最新バージョンで実装された動的デフラグ機能について長々と説明します。断片化とデフラグ任意のサイズのデータを管理する記憶装置においては、利用可能領域の断片化（fragmentation）の問題が常につきまといます。ファイルシステム上で任意のサイズのファイルを管理する際にも、データベースファイル内で任意のサイズのレコードを管理する際にも、C言語のmalloc/free関数群でメモリの管理をする際にも、様々なレイヤで断片化が起きうるのです。なぜなら、データを削除もしくは移動した際の空き領域を再利用するにあたって、その領域と同じサイズのデータが常に入ってくるとは限らないからです。特にデ
TAKESAKO 2009/05/25
mixi

db

algorithm
リンク
きまぐれ日記: 「読めてしまう」コピペがなぜ読めてしまうのか
http://www.asks.jp/users/hiro/59059.html http://www.itmedia.co.jp/news/articles/0905/08/news021.html 最初読んだとき、違和感なく読めてしまったのですが、よくよく見てみると、そんなトリックがあったのですね。さて、この「読めてしまう」がなぜよめてしまうのでしょうか？人間の言語モデルの単語パープレキシティは、約100ぐらいであると言われています。どういうことかというと、人間が文章を読んでいるときに、次の単語を過去の文章から推測するのは 1/100　程度の確率で正解するということです。件のコピペですが、最初の文字は変わらないので、その正解率は平仮名の数(52)倍になります。すなわち、52/100 =~ 0.5　実際には、最後の文字も変わらないし、単語の長さが変わらないというもの、大きな
TAKESAKO 2009/05/14
自然言語処理

algorithm

nlp
リンク
http://www.codecomments.com/message365155.html
TAKESAKO 2009/05/01
sort

x86

sse

algorithm
リンク
1 2 3 4 次のページ