perl正規表現で制御コードを除去する
RSSの収集をオリジナルのプログラムで行っている。
稀に制御コードが入っていることがあった。
制御コードが入っていると、オリジナルプログラムで利用しているXML::Simpleが異常終了してしまう。
なので、不要な制御コードを除去してからXML::Simpleを利用したい。
1 2 3 4 5 6 7 8 | use LWP::Simple qw(get); use XML::Simple; my $url = "http://www.xxx.yyy/feed.rdf"; my $xml = get($url); $xml =~ s/[[cntrl:]]//g; my $xs = Xml::Simple-new; my $obj = $xs->XMLin($xml); |
これで制御コードが入ったRSSでも処理できるようになった。
同じタグの記事
- macOSをHigh Sierraに更新した。スクリプト実行環境のバージョンは変わったのか
- macOSをMojaveに更新した。スクリプト実行環境のバージョンは変わったか
- perlで日付を扱うならTime::Piece
- perlワンライナー
- バッチ処理の基本・ファイル入出力
同じカテゴリの記事