perl正規表現で制御コードを除去する
RSSの収集をオリジナルのプログラムで行っている。
稀に制御コードが入っていることがあった。
制御コードが入っていると、オリジナルプログラムで利用しているXML::Simpleが異常終了してしまう。
なので、不要な制御コードを除去してからXML::Simpleを利用したい。
use LWP::Simple qw(get);
use XML::Simple;
my $url = "http://www.xxx.yyy/feed.rdf";
my $xml = get($url);
$xml =~ s/[[cntrl:]]//g;
my $xs = Xml::Simple-new;
my $obj = $xs->XMLin($xml);
これで制御コードが入ったRSSでも処理できるようになった。
同じタグの記事
- macOSをHigh Sierraに更新した。スクリプト実行環境のバージョンは変わったのか
- macOSをMojaveに更新した。スクリプト実行環境のバージョンは変わったか
- perlで日付を扱うならTime::Piece
- perlワンライナー
- バッチ処理の基本・ファイル入出力
同じカテゴリの記事
コメントを残す