jp.go.nict.langrid.wrapper.workflowsupport.util
クラス StringUtil

java.lang.Object
  上位を拡張 jp.go.nict.langrid.wrapper.workflowsupport.util.StringUtil

public class StringUtil
extends Object

文字列関連クラス

作成者:
Jun Koyama, Takao Nakaguchi

コンストラクタの概要
StringUtil()
           
 
メソッドの概要
static String createWord(boolean isBlank, Morpheme[] morphemes, int startIndex, int numberOfMorphemes)
          形態素配列から文章を生成する
static Morpheme[] escapeCharacterRestructing(Morpheme[] morphemes)
          HTMLエスケープ文字列が含まれている形態素を再構成し返す。
static String full2HalfAlphabetNumeric(String str)
          全角アルファベット及び数字を半角にして返す。
static String generateCode_old(String term, int primary)
          文字列から中間コードを生成する。
static String generateCode_sha1(String term, int primary)
          文字列から中間コードを生成する。
static String generateCode(String term, int primary)
          文字列から中間コードを生成する。
static boolean isSanitizeString(String str)
           
static String markingWord(String word, int wid)
          Marking of word.
static String number2alphabet(String str)
          数字をアルファベットに変換して返す
static String reSanitize(String str)
          It returns resanitize string
 
クラス java.lang.Object から継承されたメソッド
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait
 

コンストラクタの詳細

StringUtil

public StringUtil()
メソッドの詳細

generateCode

public static String generateCode(String term,
                                  int primary)
文字列から中間コードを生成する。SHA1版。 衝突確立は上がるが、生成される文字列の長さは常に41文字以内になる。

パラメータ:
term - 対象文字列
戻り値:
中間コード文字列

generateCode_sha1

public static String generateCode_sha1(String term,
                                       int primary)
文字列から中間コードを生成する。SHA1版。 衝突確立は上がるが、生成される文字列の長さは常に41文字以内になる。

パラメータ:
term - 対象文字列
戻り値:
中間コード文字列

generateCode_old

public static String generateCode_old(String term,
                                      int primary)
文字列から中間コードを生成する。

パラメータ:
term - 対象文字列
戻り値:
中間コード文字列

number2alphabet

public static String number2alphabet(String str)
数字をアルファベットに変換して返す

パラメータ:
str - 対象文字列
戻り値:
変換結果

createWord

public static String createWord(boolean isBlank,
                                Morpheme[] morphemes,
                                int startIndex,
                                int numberOfMorphemes)
形態素配列から文章を生成する

パラメータ:
isBlank - 空白を挿入するかどうか
morphemes - 形態素配列
startIndex - 開始インデックス
numberOfMorphemes - 形態素配列数
戻り値:
生成された文章

full2HalfAlphabetNumeric

public static String full2HalfAlphabetNumeric(String str)
全角アルファベット及び数字を半角にして返す。

パラメータ:
str - 対象文字列
戻り値:
半角にした結果

escapeCharacterRestructing

public static Morpheme[] escapeCharacterRestructing(Morpheme[] morphemes)
HTMLエスケープ文字列が含まれている形態素を再構成し返す。
エスケープ文字列がバラバラになっているものを1つにして、再構成する。

パラメータ:
morphemes - 形態素の配列
戻り値:
構成しなおした形態素の配列

isSanitizeString

public static boolean isSanitizeString(String str)

reSanitize

public static String reSanitize(String str)
It returns resanitize string

パラメータ:
string - message
戻り値:

markingWord

public static String markingWord(String word,
                                 int wid)
Marking of word.

パラメータ:
word - sentence
wid - word id
戻り値: