
ソフトウェアエラーで使用できなくなっていた国際宇宙ステーションロシア側のコンピューター、再起動で回復 78
ストーリー by headless
回復 部門より
回復 部門より
ロスコスモスは8日、ソフトウェアエラー発生により使用できなくなっていた国際宇宙ステーション(ISS)ロシア側のメインコンピューターの1台が再起動により回復したことを発表した(プレスリリース、
GeekWireの記事)。
このコンピューターのトラブルをロスコスモスは6日に発表し、再起動で復旧するとの見方を示していた。ロシア側のコンピューターは3台で冗長性を持たせており、残りの2台で運用上の問題はなかったが、プログレス71補給機(16日打ち上げ予定)のドッキングに備えて信頼性を向上させるため、8日の再起動を予定していた。
再起動が行われたのはモスクワ時間8日12時5分(日本時間18時5分)。再起動は成功し、正常な動作が回復したという。その後、ISSが地球を1回半周回する間(約2時間)にテストが行われ、すべての機能に問題がないことを確認したとのことだ。
このコンピューターのトラブルをロスコスモスは6日に発表し、再起動で復旧するとの見方を示していた。ロシア側のコンピューターは3台で冗長性を持たせており、残りの2台で運用上の問題はなかったが、プログレス71補給機(16日打ち上げ予定)のドッキングに備えて信頼性を向上させるため、8日の再起動を予定していた。
再起動が行われたのはモスクワ時間8日12時5分(日本時間18時5分)。再起動は成功し、正常な動作が回復したという。その後、ISSが地球を1回半周回する間(約2時間)にテストが行われ、すべての機能に問題がないことを確認したとのことだ。
「どうやってシステムを復旧したんですか??」「再起動しただけよ。スマホと同じ」 (スコア:3)
少し前まで劇場公開されてた映画「スカイスクレイパー」でそんなシーン有った
困った時は再起動 (スコア:0)
偉大な教えかも
Re:困った時は再起動 (スコア:2)
昔、電源を落すとハードディスクがスピンアップしない可能性があるので電源断禁止ってワークステーションが。
蓋開けて指で回したってのはホント?
#うちはその前にHDD換装してた。
Re:困った時は再起動 (スコア:1)
蓋は開けないけど、起動しなかったハードディスクを軽くシェイクして
無事起動した経験ならある。
# オレがやるとき、みんな冗談だと思っていたが、無事起動したら
# 見る目が変わりましたよ。(20年ほど前の話)
後日、そのハードディスクは交換しました。
Re:困った時は再起動 (スコア:2)
約30年になるかぁ。
インターネット老人会のネタだなぁ。容量は108MByteです。
Re:困った時は再起動 (スコア:1)
25年ぐらい?もうちょっと?前ですが、Quantamの80MBが時々回らなくなってたので、手首のスナップをきかせてひねってました。 [opensource.srad.jp]
#QuantamのHDDはコストパフォーマンスが良いし、普通は信頼性高いんだけど、何年かおきに地雷なモデルが出てたような気がする
Re:困った時は再起動 (スコア:2)
これこれ、Sun SS1+の108Mのやつ。27年くらい前。
Re:困った時は再起動 (スコア:2)
一応トルクはかかっていて、ベアリングの(軽度の)固着ですから、静摩擦を乗り越えれば回り出すかと。
HDDは経験ないけど、換気扇とかでよく起こる現象なのです。
Re:困った時は再起動 (スコア:1)
SPARCstation1のQuantum HDD、スピンアップしなくなったものを実際に指で回して生き返らせたことありますよ。
Re:困った時は再起動 (スコア:2)
自分ではやる僥倖?に恵まれませんでしたので、伝聞でということで。
#SS1+だったから助かったのか?
Re: (スコア:0)
やはり再起動は万能だな
Re:困った時は再起動 (スコア:2)
Re:困った時は再起動 (スコア:1)
再起動でも、リセットスイッチを押すならいいけど、
電源を切り入りする方法をとろうとすると、
二度と立ち上がらなくなるとかいうのもある。
Re:困った時は再起動 (スコア:1)
>電源を切り入りする方法をとろうとすると、
Diskがタヒにやすそうなイメージ。
法定点検で停電があるとファイルサーバーの電源を切らざるを得ないけど、上げるときに毎回何台かDisk赤ランプ。
Re: (スコア:0)
その時は叩く!ハードを直すときの基本
Re: (スコア:0)
再起動、これwindowsの常識!
Re: (スコア:0)
コンピューターと言えばWindowsですねわかりますん。
MSXだったりするんだろうか (スコア:0)
さすがに違うか
何がニュース? (スコア:0, すばらしい洞察)
ソフトエラーと特定できていたのなら再起動で回復するのは当然で、どこにニュースとしての価値があるんだろうか?
http://www.hitachi.co.jp/rd/portal/glossary/jp_so/sofutoeraa.html [hitachi.co.jp]
Re:何がニュース? (スコア:4, 参考になる)
ニュースになるくらいに再起動をしないってことだろ。確実に再起動できる保証があったり、再起動に失敗しても代替を用意できたりしないのであれば、再起動は避けたい。
そのリンク先にも書いてある「データの書き直し」が必要になった場合には、再起動するのではなく、その前に修復しておかないと再起動すらできなくなる可能性がある。その必要がないことを確認した上での再起動でしょ。
Re:何がニュース? (スコア:2)
Re:何がニュース? (スコア:4, おもしろおかしい)
まあよくある間違えかたではあるけど、よくあるのでこれを機に覚えていただきたい。
ソフトエラーはソフトウェアのバグという意味ではない!
「ソフトエラー」という単語を使って報告すると、報告のパスのどこかで必ずソフトウェアエラーに化ける。ソフトエラーだけに。
Re:何がニュース? (スコア:5, 参考になる)
Re:何がニュース? (スコア:2)
Re: (スコア:0)
どういう言い方をするのがベターなんだろう。非破壊性エラー? SEU?
Re:何がニュース? (スコア:1)
「偶発的なメモリ化けにより」とか専門家以外でも分かる一般的な用語を使うのがベター。
Re: (スコア:0)
>Roscosmos didn’t go into detail about the cause of the computer crash.
ってことで、ソフトエラーともソフトウェアエラーとも特定されてないようですね。
とはいえ、ソフトウェアのエラーなら3重系でもすべて止まるはずで、普通はソフトエラーでしょうが。
「ソフトウェアエラー」ってのはheadless氏が想像で書いたのかな。
ソフトエラーで停止した場合、再起動で回復するのは通常の仕様であり、そこまで含めて安全性を担保してるので通常の動作ですね。
再起動に不安があるならソフトエラーに対して3重系は役に立たないし、再起動を避けるべきなら単一系のままエラー率を下げる設計をする。
Re: (スコア:0)
ソフトウェアのエラーなら3重系でもすべて止まるはずで
今回のシステムがどうかは知りませんが、
この手のミッションクリティカルなシステムでは
Nバージョンプログラミング等の技法が使われていることが少なくありません。
Re: (スコア:0)
これがhylomならニュースでも何でもなかった?
Re:何がニュース? (スコア:1)
同じく
放射線が強いから、ソフトエラーはやっぱ多いだろうし...
しいていえば、3重に戻すことや、その動作確認自体はまあsrad向けな話題かなとは思う。
# でも世間向けではない話題だよな...
M-FalconSky (暑いか寒い)
Re: (スコア:0)
完全にオフトピだがsofutoeraaって強烈だな
# 自動生成か辞書順にするための苦肉の策なのだろうと
# ご理解の程お願いしたく。
Re:再起動でなおる? (スコア:0)
システムトラブルって昔から再起動を行うと大概は改善することがあるけれど
なんでなんだろう?
この手の、無知を装って他人の知識を横取りしようとするの増えたね (スコア:0)
自分で調べてごらんなさいな。
Re:この手の、無知を装って他人の知識を横取りしようとするの増えたね (スコア:1)
それはあなたが狭量になっているだけだと思いますよ。
昔から自分で調べもせずに疑問をそのままぶつけてくる学生や会社員はいたし、それに付き合ってきたコミュニティも存在していました。
しかし、もし「増えた」とか思い、それを許容できないし啓蒙もしないし、ましてや何も答えもしないのであれば、単に去るのがいいです。
なぜなら今後も「増える」と思われるからです。
ちなみに、ソフトエラーが再起動で直るのは、たいていのコンピューターシステムでは再起動のシークンス内で主記憶の内容が破棄され、起動中に改めて補助記憶からロードされるからです。
主記憶の内容には、起動中にロードされたプログラムや、それらが読み書きしたデータが入っていますし、それらはコンピューターシステムの動作状態そのものです。
従って、コンピューターシステムにエラーが発生しているとしたら再起動によってその状態も一度破棄され、改めて補助記憶装置から正しいプログラムやデータがロードされることで直ります。
ただ、補助記憶の内容が常に正しいとは限りませんし、こういったミッションで使われるコンピューターシステムは、様々なサブシステムの制御や監視に使われていると思うので、再起動後にそれらの状態とメインコンピューターの整合性が正しく取れるかは設計や状況によると言えるでしょう。
Re:この手の、無知を装って他人の知識を横取りしようとするの増えたね (スコア:1)
Re: (スコア:0)
結局何言ってんのかわかんねー
Re: (スコア:0)
ごめんね。
つまり、再起動で直るのは
エラーの状態を捨てて
始めからやり直すからだよ。
Re: (スコア:0)
この程度の分量が読めない人はTwitterに引きこもってるほうが幸せになれるよ
Re:この手の、無知を装って他人の知識を横取りしようとするの増えたね (スコア:1)
時間は有限。無駄の多い文章でも読んでもらえると思ってるならそれは甘え。
Re: (スコア:0)
stack over flowだと調べりゃわかること聞くとすぐコメントで指摘され質問がクローズされるよね
しかしこれは、許容してるとゴミ質問で埋もれちゃうからそうしてるのであって、「他人の知識を横取り」させたくないからじゃない。
実際に横取りされるのは知識じゃなくて時間とか労力だ
そして調べてあげても「フーン( ´_ゝ`)」みたいな反応で死にたくなる
Re: (スコア:0)
無知を装うとは?
知識を横取りしようとしているのなら、それは知らないからであって、つまり無知なのでは。。。?
Re: (スコア:0)
ブルースクリーンが出たらまずは再起動以外の対処法が無いから
Re:再起動でなおる? (スコア:1)
灰になりそうだなぁ。
メモリ上のデータを直接書き換えて復旧したなんて話を聞いた覚えもあるけど、
本当だったんだろうか。
Re: (スコア:0)
変な電波を受信したからだよ
電磁波かもしれないしニュートリノかもしれないし他の何かかもしれないけど。
Re: (スコア:0)
別にシステムトラブルに限らない
難しい問題も最初に戻って解き直すとあっさり解けるのはよくあることだし
箱の中の探し物だって全部出して詰め直せば簡単に見つかる
ややこしい相談だって一から話をさせれば答えの要所は見えてくるものだ
ごくごくありふれた事象
Re: (スコア:0)
油断すると、ちゃぶ台返し
Re: (スコア:0)
スキャンして修復するから?fsckがかかるから?
Re: (スコア:0)
ノイズとかで誤動作とか、/var/tmpを消すとか、メモリリークでスワップが無くなったとか、正しくタイムアウト&リトライするような設計になってないとか、起動時にしかガベージコレクションしない設計とか、とりあえず無かったことにするとか、そういう場合は再起動して初期化が有効化かと
Re: (スコア:0)
メモリ内容(状態)が異常になり、その内容に依存する処理が行えない場合、再起動で正常なメモリ内容(状態)にすれば復帰する。
メモリ内容(状態)が異常になる原因としては、ソフトウェアのバグによるもの、放射線などの影響によりデータが化けた場合などが考えられる。
ラッチアップ(半導体内で本来想定しない箇所が導通状態となり、その電流で導通状態が維持されるなどの現象)が発生した場合、本来の動作が行えなくなる。
電源断で回復する可能性があるが発生中の動作はソフトから見ればハードの故障。焼損などが起きなければ、一度電源を切ることで正常状態に復帰する。
原因としては設計・制御ミスなどによる異常電圧や、放射線の影響などが考えられる。
バグや不具合がなくても放射線で一定量のエラーは出てしまうってーのが面倒よねー……
てっきり、誰かが (スコア:0)
早口でしゃべりながらOSを書き換えたのかと思って期待したが、ただの再起動か。