おいちゃんと呼ばれています

ウェブ技術や日々考えたことなどを綴っていきます

Jakarta Commons HttpClient によるSBI証券での自動売買(4) - 正規表現でデータ解析編(例外処理つき)

以前はコードが見づらくなるかなとの理由で例外処理を省略したコードを書きましたが,どうせ必要なので,今回,例外処理つきのコードを書いてみます。

< なお,今回のコードでは,例外処理は省略しました。セットした企業コード(campanyCd)に対して,対象銘柄がない場合や,対象銘柄があっても,それが投資信託などで,会社四季報の情報がない場合などがあり得るので,なんらかの例外処理は必要かもしれません。(それも要望がございましたらコメントしてください。また別の機会にがんばってみたいと思います。)
<

様々な理由によりうまくデータが取得できなかったときには SBI_Exception という例外を,企業コードに対して対象銘柄がなかったときには NoCampanyException という例外を発生させるようにしています。

**サンプルコード

|java| import java.io.; import java.util.regex.;

public class ParseCampanyContentsSample {

/**
 * 企業コード
 */
private String campanyCd;

/**
 * 企業概要ページの内容
 */
private BufferedReader campanyContents;

/**
 * 企業名
 */
private String campany;

/**
 * 優先市場
 */
private String market;

/**
 * 会社四季報の記事作成日
 */
private String memoDay;

/**
 * 企業サイトのURL
 */
private String campanyUrl;

/**
 * 会社四季報に掲載されている業種
 */
private String gyosyu;

/**
 * 決算月 数字のみ
 */
private int kessanMonth;

/**
 * 特色 【特色】は除く
 */
private String tokusyoku;

/**
 * 連結事業または単独事業の売上構成
 * 【連結事業】または【単独事業】という文言は除く
 */
private String jigyo;

/**
 * 会社四季報のコメント
 */
private String memo;

/**
 * 会社四季報のコメント2
 */
private String memo2;

/**
 * 会社四季報の企業概要ページの内容から企業データを取得する
 * 
 * @throws SBI_Exception
 * @throws NoCampanyException
 */
public void perseCampanyContents() throws SBI_Exception, NoCampanyException {

    Pattern pattern;
    Matcher matcher;

    int i = 0;
    boolean gotJigyo = false;
    boolean gotMemo = false;
    boolean gotMemo2 = false;

    int campanyCdRow = 0;
    int campanyRow = 0;
    int gyosyuRow = 0;
    int jigyoRow = 0;
    int memoRow = 0;

    String line;
    try {
        while ((line = this.campanyContents.readLine()) != null) {
            i++;

            // 当社優先市場
            // なぜか次の正規表現では引っかからなかった
            // pattern =
            // Pattern.compile("<div class=\"margin-1\" style=\"margin-top:2px\">&nbsp;(.+)&nbsp;<font class=\"stext-gray\">(当社優先市場)</font>");

            // 不本意ながら,次の正規表現で拾う
            pattern = Pattern
                    .compile(".*<div class=\"margin-1\" style=\"margin-top:2px\">&nbsp;(.+)&nbsp;<font class=\"stext-gray\">(当社優先市場)</font>.*");
            matcher = pattern.matcher(line);
            if (matcher.matches() == true) {
                this.market = matcher.group(1);
            }

            // 作成日
            pattern = Pattern
                    .compile("作成日:([0-9]{4})年([0-9]{1,2})月([0-9]{1,2})日");
            matcher = pattern.matcher(line);
            if (matcher.matches() == true) {
                this.memoDay = matcher.group(1) + "/" + matcher.group(2) + "/" + matcher.group(3);
                continue;
            }

            // 企業コードから対象行を取得
            // なぜか次のif文だとうまくいかない → 原因が分かり次第,修正します
            // if(line == this.campanyCd) {

            // 不本意ながら,無駄に正規表現を使う
            pattern = Pattern.compile("^" + this.campanyCd);
            matcher = pattern.matcher(line);
            if (matcher.matches() == true) {
                campanyCdRow = i;
                campanyRow = campanyCdRow + 2;
                gyosyuRow = campanyRow + 4;
                continue;
            }

            // 企業名
            if (i == campanyRow) {
                this.campany = line.replace("(株)", "");
                continue;
            }

            // 業種
            if (i == gyosyuRow) {
                this.gyosyu = line;
                continue;
            }

            // URL
            pattern = Pattern.compile("【URL】<a href=\"(.+)");
            matcher = pattern.matcher(line);
            if (matcher.matches() == true) {
                this.campanyUrl = matcher.group(1);
                continue;
            }

            // 決算月
            // 3月 のパターンと,3.14 のパターンがある
            pattern = Pattern.compile("【決算】([0-9]{1,2})[月.][0-9]{0,2}");
            matcher = pattern.matcher(line);
            if (matcher.matches() == true) {
                this.kessanMonth = Integer.parseInt(matcher.group(1));
                continue;
            }

            // 特色
            pattern = Pattern.compile("【特色】(.+)");
            matcher = pattern.matcher(line);
            if (matcher.matches() == true) {
                this.tokusyoku = matcher.group(1);
                continue;
            }

            // 事業
            pattern = Pattern.compile("(?:【連結事業】|【単独事業】)(.+)");
            matcher = pattern.matcher(line);
            if (matcher.matches() == true) {
                this.jigyo = matcher.group(1);
                jigyoRow = i;
                gotJigyo = true;
                memoRow = jigyoRow + 9;
                continue;
            }

            // メモ
            // なぜか次の正規表現では引っかからなかった
            // → 原因が分かり次第,修正します
            // pattern = Pattern.compile("^【");

            // 不本意ながら次の正規表現で
            pattern = Pattern.compile("【(.+)");
            matcher = pattern.matcher(line);
            if (i >= memoRow && matcher.matches() == true
                    && gotJigyo == true && gotMemo == false) {
                this.memo = matcher.group(0);
                memoRow = i;
                gotMemo = true;
                continue;
            }

            // メモ2
            pattern = Pattern.compile("【(.+)");
            matcher = pattern.matcher(line);
            if (i >= memoRow && matcher.matches() == true
                    && gotMemo == true && gotMemo2 == false) {
                this.memo2 = matcher.group(0);
                gotMemo2 = true;
                break;
            }

            // 以下,例外
            // 別メソッドにしようと考えていたが,
            // campanyContents を readline で読み取るため,
            // 続けて記述する

            String errorMessage;
            errorMessage = ".*お客様のご選択されたサービスは受付出来ませんでした。.*";
            if (Pattern.matches(errorMessage, line) == true) {
                throw new SBI_Exception(errorMessage);
            }

            // ログインされていないとき
            errorMessage = ".*こちらの情報およびサービスをご利用いただくためには、顧客サイトへのログインが必要です。.*";
            if (Pattern.matches(errorMessage, line) == true) {
                throw new SBI_Exception(errorMessage);
            }

            // 対象銘柄がないときというのは通常起こり得るケースなので,スキップするだけ
            errorMessage = ".*対象銘柄はありません。.*";
            // errorMessage = ".*";
            if (Pattern.matches(errorMessage, line) == true) {
                throw new NoCampanyException(errorMessage);
            }

            // 投資信託などのときは,会社四季報の情報が提供されていない
            // これも通常起こり得るケースなので,スキップするだけ
            errorMessage = ".*お客様が選択された銘柄の投資情報は、現在提供しておりません。.*";
            if (Pattern.matches(errorMessage, line) == true) {
                throw new NoCampanyException(errorMessage);
            }
        }

    } catch (IOException e) {
        e.printStackTrace();

    }
}

} ||<

なお,独自の例外クラスをつくる際には,Exception クラスを継承してあげなければいけませんが,それは別のところに書きました(下記)。

|java| /* * SBI証券のサイトの操作時に発生する例外 * 例えば,サイト内容をうまく取得できなかった場合など / public class SBI_Exception extends Exception {

/**
 * コンストラクタ
 * 
 * @param message
 */
public SBI_Exception(String message) {
    super(message);
}

}

/* * SBI証券のサイトの操作時,対象銘柄がなかったときに発生する例外 / public class NoCampanyException extends Exception {

/**
 * コンストラクタ
 * 
 * @param message
 */
public NoCampanyException(String message) {
    super(message);
}

} ||<

**補足 やはり,例外処理というものを確立させた Java の功績というのは大きいですね。例外処理のメリットについて「コードが見やすくなる」ということがよく1番に挙げられますが,もちろんそれもそうなんですが,

最大のメリットは,

例外の後処理をきちんとしてないと,コンパイル時に叱ってくれる << ということなのではと思います。特に他の人が書いたコードを扱うときなんかは,このメリットはすごく大きいです。

次の本がそのあたり詳しいです。いまは PHP などでも例外処理が当たり前になってきているみたいなので,例外処理っていまいち分かんないんだよねって方にはぜひおススメです。(という僕もまだまだ修行中の身ですが...)

オブジェクト指向でなぜつくるのか―知っておきたいプログラミング、UML、設計の基礎知識―

オブジェクト指向でなぜつくるのか―知っておきたいプログラミング、UML、設計の基礎知識―

次回は,取得したデータをデータベース(MySQL)に格納する処理を書こうかなと思います(JDBC)。

**このエントリーのつづき -Jakarta Commons HttpClient によるSBI証券での自動売買(5) - データベース連携の準備編

**関連エントリー -Jakarta Commons HttpClient によるSBI証券での自動売買(3) - 正規表現でデータ解析編 -Jakarta Commons HttpClient によるSBI証券での自動売買(2) - 会社四季報の企業概要を取込む編 -Jakarta Commons HttpClient によるSBI証券での自動売買(1) - ログイン編

**おまけ フィールドに格納した値を確認するためのメソッドも書いておきました。自分で書くのが面倒な人は,これをコピペして自由につかってください。

|java| /* * フィールドを確認する / public void showField() { System.out.println("campanyCd: " + this.campanyCd); System.out.println("market3: " + this.market3); System.out.println("campany: " + this.campany); System.out.println("market: " + this.market); System.out.println("memoDay: " + this.memoDay); System.out.println("campanyUrl: " + this.campanyUrl); System.out.println("gyosyu: " + this.gyosyu); System.out.println("kessanMonth: " + this.kessanMonth); System.out.println("tokusyoku: " + this.tokusyoku); System.out.println("jigyo: " + this.jigyo); System.out.println("memo: " + this.memo); System.out.println("memo2: " + this.memo2); } ||<