SQLiteトランザクションデータベースのページサイズの問題の解決
全トランザクション履歴(または極めて大量のトランザクション履歴)が記録されているrippled
サーバと、0.40.0(2017年1月リリース)よりも古いバージョンのrippled
で最初に作成されたデータベースでは、SQLiteデータベースのページサイズが原因でサーバが適切に稼働しなくなる問題が発生する可能性があります。最近のトランザクション履歴のみが保管されているサーバ(デフォルト構成)と、バージョン0.40.0以降のrippled
でデータベースファイルが作成されているサーバでは、この問題が発生する可能性はそれほどありません。
このドキュメントでは、この問題の発生時に問題を検出し解決する手順を説明します。
背景
rippled
サーバではトランザクション履歴のコピーがSQLiteデータベースに保管されます。バージョン0.40.0より古いrippled
では、このデータベースの容量は約2TBに設定されました。ほとんどの場合はこの容量で十分です。ただし、レジャー32570(本番環境XRP Ledgerの履歴で利用可能な最も古いレジャーバージョン)以降の全トランザクション履歴は、このSQLiteデータベースの容量を超える可能性があります。rippled
サーババージョン0.40.0以降では、これよりも大きな容量でSQLiteデータベースファイルが作成されているため、この問題が発生する可能性は低くなります。
SQLiteデータベースの容量は、データベースの ページサイズ パラメーターによって決まります。この容量は、データベース作成後は容易に変更できません。(SQLiteの内部についての詳細は、SQLite公式ドキュメントをご覧ください。)データベースが保管されているディスクとファイルシステムに空き容量がある場合でも、データベースが容量いっぱいになることがあります。以下の「解決策」で説明するように、この問題を回避するためにページサイズを再構成するには、時間のかかる移行プロセスが必要です。
ヒント: ほとんどの場合、rippled
サーバの稼働に全履歴が必要となることはありません。サーバにトランザクションの全履歴が記録されていれば、長期分析やアーカイブ、または災害に対する事前対策に役立ちます。リソースを大量に消費せずにトランザクション履歴を保管する方法については、履歴シャーディングをご覧ください。
検出
サーバがこの問題に対して脆弱である場合は、次の2種類の方法でこの問題を検出できます。
- ご使用の
rippled
サーバが[バージョン1.1.0][新規: rippled 1.1.0]以降の場合、(問題が発生する前に)事前に問題を検出できます。 - (サーバがクラッシュした場合)どの
rippled
バージョンでも、問題を事後に特定できます。
いずれの場合でも、問題を検出するにはrippled
のサーバログへのアクセスが必要です。
ヒント: このデバッグログの位置は、rippled
サーバの構成ファイルの設定に応じて異なる可能性があります。デフォルトの構成では、サーバのデバッグログは/var/log/rippled/debug.log
ファイルに書き込まれます。
事前の検出
SQLiteのページサイズの問題を事前に検出するには、 [rippled 1.1.0][新規: rippled 1.1.0]以上を実行している必要があります。rippled
サーバは、以下のようなメッセージをデバッグログに定期的に(少なくとも2分間隔で)書き込みます。(ログエントリの正確な数値とトランザクションデータベースへのパスは、ご使用の環境に応じて異なります。)
Transaction DB pathname:/opt/rippled/transaction.db; SQLite page size:1024 bytes; Free pages:247483646; Free space:253423253504 bytes; Note that this does not take into account available disk space.
SQLite page size: 1024 bytes
という値は、トランザクションデータベースが小さいページサイズで構成されており、全トランザクション履歴に対応できる容量がないことを示しています。この値がすでに4096バイト以上の場合、SQLiteデータベースにはすでに全トランザクション履歴を保管できる十分な容量があり、このドキュメントで説明する移行を行う必要はありません。
rippled
サーバは、このログメッセージに示されているFree space
が524288000バイト(500MB)未満になると停止します。空き容量がこのしきい値に近づいている場合は、予期しない停止を回避するためにこの問題を解決してください。
事後の検出
サーバのSQLiteデータベース容量をすでに超えている場合には、rippled
サービスがこの問題を示すログメッセージを書き込み、停止します。
rippled 1.1.0以降
rippled
バージョン1.1.0以降では、サーバは以下のようなメッセージをサーバのデバッグログに書き込み、通常の方法でシャットダウンします。
Free SQLite space for transaction db is less than 512MB.To fix this, rippled must be executed with the vacuum <sqlitetmpdir> parameter before restarting. Note that this activity can take multiple days, depending on database size.
rippled 1.1.0より前
バージョン1.1.0より前のrippled
では、サーバが繰り返しクラッシュし、以下のようなメッセージがサーバのデバッグログに書き込まれます。
Terminating thread doJob:AcquisitionDone: unhandled N4soci18sqlite3_soci_errorE 'sqlite3_statement_backend::loadOne: database or disk is full while executing "INSERT INTO [...]
解決策
この問題を解決するには、このドキュメントで説明する手順に従い、サポートされているLinuxシステムでrippled
を使用します。推奨されるハードウェア構成とおおよそ一致するシステムスペックで全履歴を記録するサーバの場合、このプロセスにかかる日数は2日を超える可能性があります。
前提条件
[rippledバージョン1.1.0][新規: rippled 1.1.0]以上を実行している必要があります。
このプロセスを開始する前に、安定した最新バージョンにrippledをアップグレードします。
以下のコマンドを実行して、ローカルにインストールした
rippled
のバージョンを確認できます。rippled --version
rippled
ユーザが書き込めるディレクトリーに、トランザクションデータベースの2つめのコピーを一時的に保管するのに十分な空き容量が必要です。この空き容量は、既存のトランザクションデータベースと同じファイルシステムに設ける必要はありません。トランザクションデータベースは、構成の
[database_path]
設定で指定されるフォルダーのtransaction.db
ファイルに保管されます。このファイルのサイズを調べ、必要な空き容量を確認できます。次に例を示します。ls -l /var/lib/rippled/db/transaction.db
移行プロセス
トランザクションデータベースを大きなページサイズに移行するには、以下の手順を実行します。
すべての前提条件を満たしていることを確認します。
移行プロセスの実行中に一時ファイルを保管するフォルダーを作成します。
mkdir /tmp/rippled_txdb_migration
rippled
ユーザに、一時フォルダーの所有権を付与します。これにより、ユーザは一時フォルダー内のファイルに書き込みできるようになります。(rippled
ユーザがすでにアクセス権限を持つ場所に一時フォルダーがある場合は、この操作は不要です。)chown rippled /tmp/rippled_txdb_migration
一時フォルダーに、トランザクションデータベースのコピーを保管するのに十分な空き容量があることを確認します。
たとえば、
df
コマンドのAvail
出力と、transaction.db
ファイルのサイズを比較します。df -h /tmp/rippled_txdb_migration Filesystem Size Used Avail Use% Mounted on /dev/sda2 5.4T 2.6T 2.6T 50% /tmp
rippled
がまだ稼働している場合は停止します。sudo systemctl stop rippled
screen
セッション(または類似のツール)を開き、ログアウトしてもプロセスが停止しないようにします。screen
rippled
ユーザになります。sudo su - rippled
一時ディレクトリへのパスを指定した
--vacuum
コマンドで、rippled
実行可能ファイルを直接実行できます。/opt/ripple/bin/rippled -q --vacuum /tmp/rippled_txdb_migration
rippled
実行可能ファイルにより次のメッセージが即時に表示されます。VACUUM beginning. page_size:1024
プロセスが完了するまで待ちます。これには丸2日以上かかることがあります。
プロセスが完了したら、
rippled
実行可能ファイルは以下のメッセージを表示して終了します。VACUUM finished. page_size:4096
待機している間に
screen
セッションを切り離すには、CTRL-Aを押してからDを押します。その後、以下のようなコマンドでスクリーンセッションを再接続します。screen -x -r
プロセスが完了したら、スクリーンセッションを終了します。
exit
screen
コマンドについての詳細は、公式Screenユーザマニュアルまたはオンラインで使用可能なその他の多数のリソースをご覧ください。rippled
サービスを再起動します。sudo systemctl start rippled
rippled
サービスが正常に起動したかどうかを確認します。コマンドラインインターフェイスを使用してサーバの状況を確認できます(サーバがJSON-RPCリクエストを受け入れないように設定している場合を除く)。次に例を示します。
/opt/ripple/bin/rippled server_info
このコマンドの予期されるレスポンスの説明については、server_infoメソッドドキュメントをご覧ください。
サーバのデバッグログを参照し、
SQLite page size
が現在4096であることを確認します。tail -F /var/log/rippled/debug.log
また定期的なログメッセージには、移行前に比べて非常に多くのフリーページとフリースペースが示されているはずです。
必要に応じて、移行プロセスのために作成した一時フォルダーをこの時点で削除できます。
rm -r /tmp/rippled_txdb_migration
トランザクションデータベースの一時コピーを保持するために追加のストレージをマウントした場合は、この時点でそのストレージをアンマウントして取り外すことができます。