lynx   »   [go: up one dir, main page]

タグ

Operationに関するmusescapeのブックマーク (5)

  • はてなのインフラを支える「ビジョン」と「数値化」 - @IT自分戦略研究所

    第38回 はてなのインフラを支える「ビジョン」と「数値化」 岑康貴(@IT自分戦略研究所) 赤司聡(撮影) 2009/11/2 田中慎司(たなかしんじ) はてな 執行役員 博士(情報学) 1974年生まれ、愛知県出身。2006年、京都大学大学院 情報学研究科 社会情報学専攻 博士後期課程修了。NTTネットワークサービスシステム研究所を経て2006年はてな入社。サーバ/インフラの設計・構築・運用の責任者。著書に「サーバー/インフラを支える技術」(共著、技術評論社)。 ■半分は「流れ」でインフラのリーダーに はてなでインフラを担当して、もうすぐ2年になります。元々、新卒でNTTの研究所に入って、6年ほど研究員として働いていました。その後、大学の同期だった近藤(はてな 代表取締役の近藤淳也氏)に誘われて、はてなに2006年に入社しました。最初はサービス開発がメインだったんですよ。まだそのころは開

  • http://life.llx.jp/saitama/

  • 障害予防の 7 箇条

    # 運用オペレーションの実務を経験された方は身に染みて分かっているし、 # それぞれのノウハウもあると思うけど、ジブンが経験したことを踏まえ、 # 自戒の念を込めて書いてみる。 番運用中にもしも障害を起こしたら、その後始末はとても大変です。 関係各所へ連絡をして原因や影響範囲を調べ、障害報告書を書いて…あぁおそろしや。 ですから、番運用でのオペレーションはできる限り慎重にし、手間をかけるべきです。 手間をかけても障害を起こした後の大変さに比べれば大したものではありません。 (ただ、障害発生後の後始末を通して得られる経験値は高く、さまざまなノウハウや文書作成能力の向上などは特典といえるかもしれません。;-) とはいえ、やはり障害は対外的な信用を低下させ、モチベーションも下がるので起こしたくないもの。 そこで、実際に(運用オペレーション時における)障害を防止するためにはどういう

  • アクトビラで障害が発生。復旧は24日以降の見込み

    アクトビラは24日、テレビ向けポータルサービス「アクトビラ」で12月23日午前3時30分頃から障害が発生していることを明らかにした。復旧は24日以降を見込んでいる。 発生している障害は、映像配信サービス「アクトビラ ビデオ」でシステム障害が発生したことが原因。これにより、12月23日午前3時30分より、アクトビラサービスが利用できなくなっている。 アクトビラでは復旧作業を進めているが、復旧が完了するのは24日以降の見込みと告知。なお、12月19日にツタヤオンラインが開始したダウンロードサービスに関しては、利用できるという。 [記事更新:2008/12/24 20:20] アクトビラは24日夜にサービスを部分再開したと発表した。同社によれば、ビデオコンテンツ配信業務を委託するインターネットイニシアティブ(IIJ)において、配信用ビデオコンテンツのほぼすべてのデータを誤削除したのが障害の理由と

    musescape
    musescape 2008/12/25
    「配信用ビデオコンテンツのほぼすべてのデータを誤削除したのが障害の理由という。」えー、なにそれ
  • 「うっかり」ミスは無くせる---目次

    あっ、と気付いたときは手遅れだ。運用操作を間違えた、パラメータの変更を忘れた、障害対応を誤った――。作業者の「うっかりミス」によるシステム障害が止まらない。誌が過去3年に発生したトラブルの原因を調べたところ、全体の半分に達した。作業者を責めたり責任者を処罰したりしても、ミスは減らない。ミスを誘発する根的な原因を突き止めて対策を講じることが不可欠だ。うっかりミスをなくす方策を探る。 トラブル原因の半分が「うっかり」 7割が「うっかり」に直面 叱るより真因を追究、対策べからず集 5人の識者が語る「うっかり」防止の心構え

    「うっかり」ミスは無くせる---目次
  • 1
Лучший частный хостинг