10. 種々のデータ構造

この文章では、大きいデータを Haskell で扱うほう方法について述べます。
Array, FiniteMap, IORef, Array.IO, HashTable を紹介します。

1. リストが関数型言語のデータとして用いられている理由

関数型言語でリストが多く用いられているのは、リストは Cons する分には、データを全て作り直す必要がなく、 Cons した分を付け足してそこのポインターを新しいリストとみなせるからです。

例えば、[1,2,3] というリスこれに、0 を Cons するとして取り扱うことが出来ます。つまり、コンスセルの先なります。ただし、すでに存在する作る必要があります。ま従って、参照を頻繁に行 [図１]

2. Array

Haskell 98 には Array 型が定義参照を行うことが出来ます。Array 更新には O(n) かかります。使うと良いでしょう。また、Array Array を作成するには関数 (!) 、更新には (//) を使いまペアのリストはそれぞれ、bounds, 詳しくは Haskell 98 例：三角関数の表を作りそれを利用して値を返す。

 01: 02: 03: 04: 05: 06: 07: 08: 09: 10: 11: 12: 13: 14: 15: 16: 17: 18: 19: 20: 21: 22: 23:

 D:\doc\05-04\hs>runhugs ar.hs give sin/cos (angle) sin 3 sin 3 = 0.141120008059867 give sin/cos (angle) cos 120 cos 120 = 0.814180970526562 give sin/cos (angle) cos 299 cos 299 = -0.853204385517229 give sin/cos (angle)

D:\doc\05-04\hs>

3. FiniteMap

Finite Map は平衡木を関数的大きなデータの取り扱いは List や Array より有利です。
主な関数を挙げます。

emptyFM	新たに FiniteMap を生成します。例： emptyFM :: FiniteMap
addToFM fm key val	FiniteMap fm に
delFromFM fm key	FiniteMap fm から
elemFM key fm	key が FiniteMap
lookupFM fm key	FiniteMap fm の要素のうち
listToFM alist	連想リスト
fmToList fm	FiniteMap fm を連想リ

例として、ファイルの単語の出現回数を調べるプログラムを示します。

[code 1]

 01: 02: 03: 04: 05: 06: 07: 08: 09: 10: 11: 12: 13: 14: 15: 16: 17: 18: 19: 20: 21: 22: 23: 24: 25: 26: 27:

4. IORef

IORef を使うと Haskell ほとんど手続き型言語のよ

関数名	型	説明
newIORef	a -> IO (IORef a)	値 a を持つ新しい IORef を作ります。
readIORef	IORef a -> IO a	IORef から値を読みます。
writeIORef	IORef a -> a -> IO()	IORef に値を書き出します。
modifyIORef	IORef a -> (a ->	IORef の値を更新します。

5. Array.IO

Haskell で大きなデータを扱うときに使います。参照、更新が O(1) で出来ます。主な関数を下に挙げます。 Array.IO はArray.MArray の instance です。

関数名	型	説明
newArray	(MArray a e m, Ix	値 e を持つ新しい配列を作成します。例: インデックスが newArray
newListArray	(MArray a e m, Ix	リストの値を持つ Array を作成例：0.0, 0.1 ..... 9.9 の値を持つ Array newListArray (0,99) [0.0,0.1..9.9]
readArray	(MArray a e m, Ix	Array から値を読む。
writeArray	(MArray a e m, Ix	Array に値を書く。

以下に１次元と２次元配列上での拡散をシミュレートするプログラムを示します。１次元配列では、あるセルの値の二次元配列では、値の初めは中央に 100.0 の値があるとします。
例：１次元配列
[code 2]

 01: 02: 03: 04: 05: 06: 07: 08: 09: 10: 11: 12: 13: 14: 15: 16: 17: 18: 19: 20: 21: 22: 23: 24: 25: 26: 27: 28: 29: 30: 31: 32: 33: 34: 35: 36: 37: 38: 39: 40: 41: 42: 43: 44:

二次元配列の場合

[code 3]

 01: 02: 03: 04: 05: 06: 07: 08: 09: 10: 11: 12: 13: 14: 15: 16: 17: 18: 19: 20: 21: 22: 23: 24: 25: 26: 27: 28: 29: 30: 31: 32: 33: 34: 35: 36: 37: 38: 39: 40: 41: 42: 43: 44: 45: 46: 47: 48: 49: 50: 51: 52: 53: 54:

実行例：図２に [code 2] を実行した結一方、図３に [code 3] を実行した結果を示します。
[図２]

[図３]

6. HashTable

ハッシュ表も使うことが出来ます。主な関数を下に示します。

関数名	型	説明
new	(key -> key -> Bool)	新しいハッシュ表を作る。最初の引数は key を比較す hashInt、文字列用の hashString があります。
insert	HashTable key val	key, val をハッシュ表に追加する。
delete	HashTable key val	key をハッシュ表から削除します。
lookup	HashTable key val	key をハッシュ表か
update	HashTable key val	ハッシュ表を key val で更新します。
fromList	Eq key => (key ->	リストからハッシュ表を作成します。
toList	HashTable key val	ハッシュ表をリストに変換します。

[code 4] にハッシュ表を使っ [code 4]

 01: 02: 03: 04: 05: 06: 07: 08: 09: 10: 11: 12: 13: 14: 15: 16: 17: 18: 19: 20: 21: 22: 23: 24: 25: 26: 27: 28:

7. 終わりに

この文章では Haskell で使えるいろいろなデータ型について述べました。より詳しくは ghc のドキュメントを参考にしてください。また、ここで述べたプログラムをまとめておきますので、気が向いたら遊んでみてください。

l/users_guide/primitives.html operations i) => (i, i) -> e -> m (a i e) 0--99 で、値が 0.0 の Array を作成
(0,99) 0.0 :: IO (IOUArray Int Double) i) => (i, i) -> [e] -> m (a i e) i) => a i e -> i -> m e i) => a i e -> i -> e -> m () 10 % が左右のセルに（左右それぞれ 5 % ずつ）、 10 % が上下左右に（上下左右それぞれ 2.5 % ずつ）に移動するとします。 --------------------------------------------------- test code for Array.IO--- simulation of diffusion--- by T.Shido (shido_takafumi@ybb.ne.jp)------------------------------------------------ import Data.Array.IO import System diffuse :: String -> Int -> IO() diffuse fout m = do state <- newArray (0,199) 0.0 :: IO (IOUArray Int Double) writeArray state 99 100.0 diff <- newArray (0,199) 0.0 :: IO (IOUArray Int Double) rep state diff 0 m where rep state diff i n | i==n = present state 0 "# diffusion:\n#cell, density\n" | otherwise = do cal_diff state diff 1 up_state state diff 0 rep state diff (1+i) n cal_diff state diff i | i == 199 = return () | otherwise = do de <- readArray state i if de /= 0.0 then do d0 <- readArray diff i dsub1 <- readArray diff (i-1) dadd1 <- readArray diff (i+1) writeArray diff i (d0 - de*0.1) writeArray diff (i-1) (dsub1 + de*0.05) writeArray diff (i+1) (dadd1 + de*0.05) cal_diff state diff (i+1) else cal_diff state diff (i+1) up_state state diff i | i==200 = return () | otherwise = do d <- readArray diff i if d /= 0.0 then do s <- readArray state i writeArray state i (s+d) writeArray diff i 0.0 up_state state diff (i+1) else up_state state diff (i+1) present state i acc | i==200 = writeFile fout acc | otherwise = do x <-readArray state i present state (i+1) (acc ++ show i ++ " " ++ show x ++ "\n") main = do av <-getArgs diffuse (head av) (read (av !! 1)) --------------------------------------------------- test code for Array.IO--- simulation of diffusion, 2D--- by T.Shido (shido_takafumi@ybb.ne.jp)------------------------------------------------ import Data.Array.IO import System -- 2 dimentinal diffusion diffuse2d :: String -> Int -> IO() diffuse2d fout m = do state <- newArray ((0,0), (49,49)) 0.0 :: IO (IOUArray (Int, Int) Double) writeArray state (24,24) 100.0 diff <- newArray ((0,0), (49,49)) 0.0 :: IO (IOUArray (Int, Int) Double) rep state diff 0 m where rep state diff i n | i==n = present state 0 0 "# deffusion:\n#cell x, cell y, density\n" | otherwise = do cal_diff state diff 1 1 up_state state diff 0 0 rep state diff (1+i) n cal_diff state diff i j | i == 49 = return () | j == 49 = cal_diff state diff (i+1) 1 | otherwise = do s0 <- readArray state (i, j) if s0 > 0 then do d0 <- readArray diff (i, j) d_up <- readArray diff ((i-1), j) d_down <- readArray diff ((i+1), j) d_left <- readArray diff (i, (j-1)) d_right <- readArray diff (i, (j+1)) writeArray diff (i, j) (d0 - s0*0.1) writeArray diff ((i-1),j) (d_up + s0*0.025) writeArray diff ((i+1),j) (d_down + s0*0.025) writeArray diff (i,(j-1)) (d_left + s0*0.025) writeArray diff (i,(j+1)) (d_right + s0*0.025) cal_diff state diff i (j+1) else cal_diff state diff i (j+1) up_state state diff i j | i == 50 = return () | j == 50 = up_state state diff (i+1) 0 | otherwise = do d <- readArray diff (i, j) if d /= 0 then do s <- readArray state (i, j) writeArray state (i, j) (s+d) writeArray diff (i, j) 0.0 up_state state diff i (j+1) else up_state state diff i (j+1) present state i j acc | i==50 = writeFile fout acc | j==50 = present state (i+1) 0 (acc ++ "\n") | otherwise = do x <-readArray state (i, j) present state i (j+1) (acc ++ show i ++ " " ++ show j ++ " " ++ show x ++ "\n") main = do av <-getArgs diffuse2d (head av) (read (av !! 1)) 果を示します。キャプションは繰り返し回数です。 -> (key -> Int32) -> IO (HashTable key val) る関数、２番目の引数は key を Int32 に変換する関数です。Int 用の -> key -> val -> IO () -> key -> IO () -> key -> IO (Maybe val) ら探し、見つかったら val を返します。 -> key -> val -> IO Bool Int32) -> [(key, val)] -> IO (HashTable key val) -> IO [(key, val)] てファイル中の単語の出現回数を数えるプログラムを示します。
--- count words module Main where import Data.HashTable import System import Char import List regword :: (HashTable String Int) -> [String] -> IO() regword _ [] = return () regword h (w:ws) = do cnt <- Data.HashTable.lookup h w case cnt of Nothing -> update h w 1 Just n -> update h w (1+n) regword h ws conv_char c = if isAlpha c then toLower c else if (isDigit c || isSpace c || c == '_') then c else ' ' main = do av <- getArgs contents <- readFile (head av) h <- new (==) hashString :: IO (HashTable String Int) regword h (words $ map conv_char contents) al <- toList h mapM_ print $ sortBy (compare . fst) al class='arrow' border=0>HOME src='../images/left_arrow.gif' class='arrow' border=0> src='../images/up_arrow.gif' class='arrow' border=0>Haskell のお勉強 src='../images/right_arrow.gif' class='arrow' border=0>11. Module src='../images/down_arrow.gif' class='arrow' border=0>download php?ref=hs/haskell10.html&t=Data+Structures' target='new'>書き込む
 IO ()