MemSQLから着実に進むAI化の波をみる
先日このコロナパンデミックの中、MemSQLが約54億円を資金調達したニュースが流れたので気になって調べてみました。
MemSQLのサービスは、世界最速のインメモリデータベースといわれ、リアルタイムに分析や検索が可能なデータウェア保管庫を実現することです。
データベースへ命令言語であるSQLコードをC++という言語に変換して、処理時間を削減することにより、爆速化させたようです。
ちなみに、インメモリデータベースとは、データの格納先を、取り出し時間がかかるディスクではなく、簡単に取り出せるメモリ領域に保存して作業させることです。
図にしたほうがわかりやすいので、わかりやすい下記の図(日経XTechより引用1,2)を参考にしてください。
メモリから呼び出すことで、応答速度が100万倍程度速くなり、仕事効率が上がります。
もともとFacebookにいた2人の技術者が2011年にサンフランシスコで創業した会社で、業績は2019年75%成長。現在の年間収益は約43億円を超え、順調に推移しています。
得意先には、米国銀行3行、大手通信事業者、Uber、Pinterest、Dell EMC、Comcast などの大物をきちんと確保しています。
なぜこのサービスが重要なのかあまりピンときていない方も多いと思われます。私も調べる前は専門用語に翻弄され理解すらできませんでした。
なので、簡単に説明すると、MemSQLのサービスは、そのデータ処理の効率化により、ビッグデータの取り扱いコストを下げ、同時にAI導入コストも下げるので、中小規模の会社のAI参入の糸口になりえ、AI化を一気に推し進めるということです。
時代が移り変わる前哨戦の話題として以下の話をシェアしていきます。
データ処理が追い付かない
ビッグデータを分析したいという話はよく聞きます。でも、いつのデータを分析したいという話はあまり聞かないように思います。
データは生もので毎日新しく生まれています。
せっかく分析するなら現況を正しく表した最新データが欲しいものです。さらに、連続したデータ変化の推移を追いかけることで正しいトレンドをつかむことができます。
ただ、これには大きな問題がついてきます。
処理したいデータの増大に、コンピュータの性能が追い付かないということです。
もう少しかみ砕いていうと、自社で生まれるまたは自社が取得する1日分のデータを、データを処理するための作業量が1日分を上回り、なかなか分析が思うように進まないということです。
確かに、分析しないよりはましかもしれないのですが、これにより、分析する情報の価値が下がってしまいます。
さらに、今後はIOTの活用などにより、処理できるデータがどんどん増えてくることが予測されるので、さらに処理完結に時間がかかり、情報の鮮度が落ちていきます。
この処理速度の問題を解決するのは3つの方法があります。
・プログラム改良による処理力向上
・処理するコンピュータの性能アップ
・処理に参加するコンピュータの台数増加(分散処理)
この3つの方法の掛け合わせで処理速度を改善するのが最良となり、MemSQLのサービスはプログラム処理力向上×分散処理で爆速化を図っています。
今後の流れとしては、いかにパソコンを連結させ分散処理(暇なパソコンに仕事を手伝ってもらうこと)をさせるかで更なる速度を手に入れることができるかどうかが決まってくるといわれています。
もちろん、この分散処理はすぐできるものではなく、制御ソフトと並列コンピュータを連結させ、仕事を割り振り、モニタリングし、最後に統合するという全体効率化を同時に行わなければいけません。
リアルタイムデータの重要性が高まる今、これらの技術に視線が集まる理由がわかったのではないでしょうか。
そして、今後の動きを注視し、適度なコスト感になったら飛び込めるように身構えておきましょう。
参考サイトのご紹介
私もこの話題を理解するために3時間以上かかりました。
というのも、IT用語とその繋がりが全く理解できず、その背景を調べまくったからです。
そのなかで下記サイトはITインフラの構造を理解する上で役に立ったので記載しておきます。
私たちの今後のビジネスに少なからず影響を与えるので新たな知識を獲得しておくといいかもしれませんね。