受動型正規表現エンジン
2006.07.27 Thursday 23:28
世の中には正規表現エンジンなるものがいくつか存在するが,文字列とパターンを与えると結果が返る形のものがほとんど.つまり検索対象は予め完全な形で用意する必要がある.しかし,逆に入力が来る都度データを与えて,パターンが見つかったら教えてくれる形の物が欲しい時がある.
次々とやってくるデータ列から特定のパターンを拾い出す場合,文字列を用意する必要がある物だと入力をどこかで区切らなくてはならず,また入力に対して即座に応答しようとすると同じような文字列に何度もパターンマッチをする必要があり効率が悪い.
予めパターンを仕込んだ状態機械を用意して,そこに文字列を断片の繰り返しとして次々と与えていく.与える都度状態が変化して,マッチするパターンが現れるとフラグが立つ.そういう物が欲しい.
この形式だと同じ部分を何度も走査する必要がないし,全体を1つととらえた複数行マッチなども可能となる.
予めパターンを仕込んだ状態機械を用意して,そこに文字列を断片の繰り返しとして次々と与えていく.与える都度状態が変化して,マッチするパターンが現れるとフラグが立つ.そういう物が欲しい.
この形式だと同じ部分を何度も走査する必要がないし,全体を1つととらえた複数行マッチなども可能となる.
Comments