パスワードを忘れた? アカウント作成
13765804 story
国際宇宙ステーション

ソフトウェアエラーで使用できなくなっていた国際宇宙ステーションロシア側のコンピューター、再起動で回復 78

ストーリー by headless
回復 部門より
ロスコスモスは8日、ソフトウェアエラー発生により使用できなくなっていた国際宇宙ステーション(ISS)ロシア側のメインコンピューターの1台が再起動により回復したことを発表した(プレスリリースGeekWireの記事)。

このコンピューターのトラブルをロスコスモスは6日に発表し、再起動で復旧するとの見方を示していた。ロシア側のコンピューターは3台で冗長性を持たせており、残りの2台で運用上の問題はなかったが、プログレス71補給機(16日打ち上げ予定)のドッキングに備えて信頼性を向上させるため、8日の再起動を予定していた。

再起動が行われたのはモスクワ時間8日12時5分(日本時間18時5分)。再起動は成功し、正常な動作が回復したという。その後、ISSが地球を1回半周回する間(約2時間)にテストが行われ、すべての機能に問題がないことを確認したとのことだ。
  • 少し前まで劇場公開されてた映画「スカイスクレイパー」でそんなシーン有った

    ここに返信
  • by Anonymous Coward on 2018年11月11日 18時11分 (#3513706)

    偉大な教えかも

    ここに返信
  • by Anonymous Coward on 2018年11月11日 18時23分 (#3513710)

    さすがに違うか

    ここに返信
  • 何がニュース? (スコア:0, すばらしい洞察)

    by Anonymous Coward on 2018年11月11日 18時42分 (#3513718)

    ソフトエラーと特定できていたのなら再起動で回復するのは当然で、どこにニュースとしての価値があるんだろうか?
    http://www.hitachi.co.jp/rd/portal/glossary/jp_so/sofutoeraa.html [hitachi.co.jp]

    ここに返信
    • by Anonymous Coward on 2018年11月11日 19時36分 (#3513739)

      ニュースになるくらいに再起動をしないってことだろ。確実に再起動できる保証があったり、再起動に失敗しても代替を用意できたりしないのであれば、再起動は避けたい。

      そのリンク先にも書いてある「データの書き直し」が必要になった場合には、再起動するのではなく、その前に修復しておかないと再起動すらできなくなる可能性がある。その必要がないことを確認した上での再起動でしょ。

    • by hakikuma (47737) on 2018年11月11日 20時08分 (#3513748)
      「ソフトエラー」と「ソフトウェアエラー」をheadlessが混同しているってのがニュースでしょ
      • Re:何がニュース? (スコア:4, おもしろおかしい)

        by quililila (23086) on 2018年11月11日 20時32分 (#3513754) 日記

        まあよくある間違えかたではあるけど、よくあるのでこれを機に覚えていただきたい。
        ソフトエラーはソフトウェアのバグという意味ではない!

        「ソフトエラー」という単語を使って報告すると、報告のパスのどこかで必ずソフトウェアエラーに化ける。ソフトエラーだけに。

      • by Anonymous Coward

        >Roscosmos didn’t go into detail about the cause of the computer crash.
        ってことで、ソフトエラーともソフトウェアエラーとも特定されてないようですね。
        とはいえ、ソフトウェアのエラーなら3重系でもすべて止まるはずで、普通はソフトエラーでしょうが。
        「ソフトウェアエラー」ってのはheadless氏が想像で書いたのかな。

        ソフトエラーで停止した場合、再起動で回復するのは通常の仕様であり、そこまで含めて安全性を担保してるので通常の動作ですね。
        再起動に不安があるならソフトエラーに対して3重系は役に立たないし、再起動を避けるべきなら単一系のままエラー率を下げる設計をする。

        • by Anonymous Coward

          ソフトウェアのエラーなら3重系でもすべて止まるはずで

          今回のシステムがどうかは知りませんが、
          この手のミッションクリティカルなシステムでは
          Nバージョンプログラミング等の技法が使われていることが少なくありません。

      • by Anonymous Coward

        これがhylomならニュースでも何でもなかった?

    • 同じく

      放射線が強いから、ソフトエラーはやっぱ多いだろうし...

      しいていえば、3重に戻すことや、その動作確認自体はまあsrad向けな話題かなとは思う。

      # でも世間向けではない話題だよな...

      --
      M-FalconSky (暑いか寒い)
    • by Anonymous Coward

      完全にオフトピだがsofutoeraaって強烈だな

      # 自動生成か辞書順にするための苦肉の策なのだろうと
      # ご理解の程お願いしたく。

  • by Anonymous Coward on 2018年11月11日 18時51分 (#3513722)

    システムトラブルって昔から再起動を行うと大概は改善することがあるけれど
    なんでなんだろう?

    ここに返信
      • それはあなたが狭量になっているだけだと思いますよ。
        昔から自分で調べもせずに疑問をそのままぶつけてくる学生や会社員はいたし、それに付き合ってきたコミュニティも存在していました。
        しかし、もし「増えた」とか思い、それを許容できないし啓蒙もしないし、ましてや何も答えもしないのであれば、単に去るのがいいです。
        なぜなら今後も「増える」と思われるからです。

        ちなみに、ソフトエラーが再起動で直るのは、たいていのコンピューターシステムでは再起動のシークンス内で主記憶の内容が破棄され、起動中に改めて補助記憶からロードされるからです。
        主記憶の内容には、起動中にロードされたプログラムや、それらが読み書きしたデータが入っていますし、それらはコンピューターシステムの動作状態そのものです。
        従って、コンピューターシステムにエラーが発生しているとしたら再起動によってその状態も一度破棄され、改めて補助記憶装置から正しいプログラムやデータがロードされることで直ります。

        ただ、補助記憶の内容が常に正しいとは限りませんし、こういったミッションで使われるコンピューターシステムは、様々なサブシステムの制御や監視に使われていると思うので、再起動後にそれらの状態とメインコンピューターの整合性が正しく取れるかは設計や状況によると言えるでしょう。

      • by Anonymous Coward

        stack over flowだと調べりゃわかること聞くとすぐコメントで指摘され質問がクローズされるよね
        しかしこれは、許容してるとゴミ質問で埋もれちゃうからそうしてるのであって、「他人の知識を横取り」させたくないからじゃない。

        実際に横取りされるのは知識じゃなくて時間とか労力だ
        そして調べてあげても「フーン( ´_ゝ`)」みたいな反応で死にたくなる

      • by Anonymous Coward

        無知を装うとは?
        知識を横取りしようとしているのなら、それは知らないからであって、つまり無知なのでは。。。?

    • by Anonymous Coward

      ブルースクリーンが出たらまずは再起動以外の対処法が無いから

    • by Anonymous Coward

      変な電波を受信したからだよ
      電磁波かもしれないしニュートリノかもしれないし他の何かかもしれないけど。

    • by Anonymous Coward

      別にシステムトラブルに限らない
      難しい問題も最初に戻って解き直すとあっさり解けるのはよくあることだし
      箱の中の探し物だって全部出して詰め直せば簡単に見つかる
      ややこしい相談だって一から話をさせれば答えの要所は見えてくるものだ
      ごくごくありふれた事象

      • by Anonymous Coward

        油断すると、ちゃぶ台返し

    • by Anonymous Coward

      スキャンして修復するから?fsckがかかるから?

    • by Anonymous Coward

      ノイズとかで誤動作とか、/var/tmpを消すとか、メモリリークでスワップが無くなったとか、正しくタイムアウト&リトライするような設計になってないとか、起動時にしかガベージコレクションしない設計とか、とりあえず無かったことにするとか、そういう場合は再起動して初期化が有効化かと

    • by Anonymous Coward

      メモリ内容(状態)が異常になり、その内容に依存する処理が行えない場合、再起動で正常なメモリ内容(状態)にすれば復帰する。
      メモリ内容(状態)が異常になる原因としては、ソフトウェアのバグによるもの、放射線などの影響によりデータが化けた場合などが考えられる。

      ラッチアップ(半導体内で本来想定しない箇所が導通状態となり、その電流で導通状態が維持されるなどの現象)が発生した場合、本来の動作が行えなくなる。
      電源断で回復する可能性があるが発生中の動作はソフトから見ればハードの故障。焼損などが起きなければ、一度電源を切ることで正常状態に復帰する。
      原因としては設計・制御ミスなどによる異常電圧や、放射線の影響などが考えられる。

      バグや不具合がなくても放射線で一定量のエラーは出てしまうってーのが面倒よねー……

  • by Anonymous Coward on 2018年11月12日 0時15分 (#3513825)

    早口でしゃべりながらOSを書き換えたのかと思って期待したが、ただの再起動か。

    ここに返信
typodupeerror

「科学者は100%安全だと保証できないものは動かしてはならない」、科学者「えっ」、プログラマ「えっ」

読み込み中...