在集圖的過程中,妳肯定會常常聽到CSV文件這個詞。那麽所謂CSV文件到底是個什麽東西呢? 它有什麽用處呢?又要如何使用呢?認真讀完下面的文字,相信妳對CSV會有壹個初步的了解。
所謂“CSV”,是Comma Separated Value(逗號分隔值)的英文縮寫,通常都是純文本文件。 下面是壹個實際CSV文件中的部分內容,讓大家對他有壹個感性的認識。我們選的是Sjojo_Rescan 的CSV文件(Sjojo是ASW-亞洲掃圖風的成員之壹)。
sj_mino1001.jpg,715282,4FB55FE8,
sj_mino1002.jpg,471289,93203C5C,
sj_mino1003.jpg,451929,C4E80467,
通常CSV文件開頭是不留空的,以行為單位,每行中記錄壹張圖片的了多項數據,每項數據用逗號 來分隔(標準英文逗號)。壹般說來集圖用的.CSV文件的格式是這樣的:
文件名,文件大小(以字節為單位),CRC校驗值,註釋(可省略)
sj_mino1001.jpg,715282,4FB55FE8,
| | | |
文件名 文件大小 CRC值 註釋(已省略)
如果妳的機器上裝了Microsoft Excel的話,.csv文件默認是被Excel打開的。需要註意的是,當妳 雙擊壹個.CSV文件,Excel打開它以後即使不做任何的修改,在關閉的時候Excel往往會提示是否要 改成正確的文件格式,這個時候千萬記得要選擇“否”。因為Excel認為.CSV 文件中的數字是要用 科學記數法來表示的,而我們要的.CSV文件中的數字是普通的。如果妳選擇了“是”的話,Excel
會把CSV文件中所有的數字用科學計數來表示(2.54932E+5這種形式),這個文件就沒法用了。 所 以如果妳的CSV文件絕大部分都是用在集圖上的話,建議把.CSV的默認打開方式改成任意壹個文本 編輯器,系統自帶的記事本就是個不錯的選擇。
好,讓我們回到CSV文件的格式中來。見上面,從左到右 sj_mino1001.jpg是文件名,715282 是以字節表示的文件大小。當文件名中包含逗號的時候,由於逗號在CSV文件中特殊的作用,為了 不至於產生歧義,需要用引號把文件名括起來。比如 "The Art, Fantasy.jpg",384211,...,.... 接著是壹個8位的16進制數字 4FB55FE8,這是文件的CRC32校驗值。整個CSV文件的精髓都在這裏。
讓我們舉個小例子來說明它的意義:Sjojo發布了壹張圖sj_mino1001.jpg,假設妳是從朋友手中拿 到這張圖的,那麽妳肯定常常會有這樣的疑問,這張圖在傳播的過程中是否被改動過呢?是否無意 中遭到了損壞呢?CRC就是為解決這個問題而存在的。壹般情況下,掃圖家每發布了壹套圖,就同 時放出壹個CSV文件(這種CSV通常叫做Official CSV,也就是官方發布的CSV的意思),這個CSV中 的CRC值是用專門的軟件通過CRC32算法(常用的CRC算法還有CRC16)對文件運算後生成的壹個值, 這個值可用作文件真身的標誌。在絕大多數情況下,如果這個文件在傳播過程中無論是大小還是內 容被改動過。那麽,用同樣的CRC32算法再對文件進行運算後產生的CRC校驗值就完全不壹樣了。如 果得出的CRC值是壹樣的,則完全有理由認為這個文件是真身,沒有被改動過。還有些時候,收來 的圖片文件名被改動過了,那麽妳怎麽知道誰是誰呢?這個時候CRC值又起作用了:用專用的軟件對圖片處理後,可以得到文件的大小和CRC值,然後根據大小和CRC值在CSV中尋找是否有適合的圖片。如果有,就會把圖片的名字改成CSV裏的。舉個例子,妳收到了壹張圖片,名字是pic0001.jpg,同時妳知道這張圖片是Sjojo_Rescan這個集子裏面的,但是不知道具體是哪壹張。用軟件得到它的大小和CRC分別是715282和4FB55FE8,那麽軟件在CSV文件裏找到壹行sj_mino1001.jpg,715282,4FB55FE8,大小和CRC都符合,軟件就認為這張圖片的原名是sj_mino1001.jpg,接著自動把文件的名字改成sj_mino1001.jpg。改動的不是CSV文件而是圖片的文件名。接下來的是註釋和說明,可以省略掉。需要註意的是註釋的後面是沒有逗號的,如果要省略註釋的話,壹定要在CRC值的後面保留壹個逗號,否則軟件會把CRC值認為是註釋的。
相信看完上面的壹大堆東西後,妳不但對CSV文件有了個大概地了解,對它的用途應該也有些模糊的概念了吧。我們收集圖片往往是通過各種各樣不同的渠道,比如從網站上,IRC上,抑或幹脆是朋友送的光盤。在整個的傳播過程中,圖片有可能遭受到各種各樣的非人待遇。尤其是從網站上收來的圖片。有些時候僅僅是簡單的改了壹下名字,更多的時候由於很多PLMM站空間有限,常把圖片的尺寸縮小,或者把圖片文件縮小。壹張1356x588的圖被改成了678x294,或者壹個四五百K的文件被縮成了幾十K都是常有的事。比較可惡的是,許多網站把原來掃圖家的Logo去掉,打上自己網站的Logo。還有些許搞笑派的玩家,把各種各樣的圖片移花接木,改頭換面。這些對於壹般的看
圖娛樂無傷大雅,但是對於集圖來說,收到這樣的圖片是無法容忍的。如何驗明圖片的正身,這是掃圖家和集圖者***同面對的問題。CSV文件就是為了解決這樣的問題而出現的。CSV文件最早用在簡單的數據庫裏,由於其格式簡單,並具備很強的開放性,所以起初被掃圖家用作自己圖集的標記。 如上面所說的,CSV文CSV文件及其使用
在集圖的過程中,妳肯定會常常聽到CSV文件這個詞。那麽所謂CSV文件到底是個什麽東西呢? 它有什麽用處呢?又要如何使用呢?認真讀完下面的文字,相信妳對CSV會有壹個初步的了解。
所謂“CSV”,是Comma Separated Value(逗號分隔值)的英文縮寫,通常都是純文本文件。 下面是壹個實際CSV文件中的部分內容,讓大家對他有壹個感性的認識。我們選的是Sjojo_Rescan 的CSV文件(Sjojo是ASW-亞洲掃圖風的成員之壹)。
sj_mino1001.jpg,715282,4FB55FE8,
sj_mino1002.jpg,471289,93203C5C,
sj_mino1003.jpg,451929,C4E80467,
通常CSV文件開頭是不留空的,以行為單位,每行中記錄壹張圖片的了多項數據,每項數據用逗號 來分隔(標準英文逗號)。壹般說來集圖用的.CSV文件的格式是這樣的:
文件名,文件大小(以字節為單位),CRC校驗值,註釋(可省略)
sj_mino1001.jpg,715282,4FB55FE8,
| | | |
文件名 文件大小 CRC值 註釋(已省略)
如果妳的機器上裝了Microsoft Excel的話,.csv文件默認是被Excel打開的。需要註意的是,當妳 雙擊壹個.CSV文件,Excel打開它以後即使不做任何的修改,在關閉的時候Excel往往會提示是否要 改成正確的文件格式,這個時候千萬記得要選擇“否”。因為Excel認為.CSV 文件中的數字是要用 科學記數法來表示的,而我們要的.CSV文件中的數字是普通的。如果妳選擇了“是”的話,Excel
會把CSV文件中所有的數字用科學計數來表示(2.54932E+5這種形式),這個文件就沒法用了。 所 以如果妳的CSV文件絕大部分都是用在集圖上的話,建議把.CSV的默認打開方式改成任意壹個文本 編輯器,系統自帶的記事本就是個不錯的選擇。
好,讓我們回到CSV文件的格式中來。見上面,從左到右 sj_mino1001.jpg是文件名,715282 是以字節表示的文件大小。當文件名中包含逗號的時候,由於逗號在CSV文件中特殊的作用,為了 不至於產生歧義,需要用引號把文件名括起來。比如 "The Art, Fantasy.jpg",384211,...,.... 接著是壹個8位的16進制數字 4FB55FE8,這是文件的CRC32校驗值。整個CSV文件的精髓都在這裏。
讓我們舉個小例子來說明它的意義:Sjojo發布了壹張圖sj_mino1001.jpg,假設妳是從朋友手中拿 到這張圖的,那麽妳肯定常常會有這樣的疑問,這張圖在傳播的過程中是否被改動過呢?是否無意 中遭到了損壞呢?CRC就是為解決這個問題而存在的。壹般情況下,掃圖家每發布了壹套圖,就同 時放出壹個CSV文件(這種CSV通常叫做Official CSV,也就是官方發布的CSV的意思),這個CSV中 的CRC值是用專門的軟件通過CRC32算法(常用的CRC算法還有CRC16)對文件運算後生成的壹個值, 這個值可用作文件真身的標誌。在絕大多數情況下,如果這個文件在傳播過程中無論是大小還是內 容被改動過。那麽,用同樣的CRC32算法再對文件進行運算後產生的CRC校驗值就完全不壹樣了。如 果得出的CRC值是壹樣的,則完全有理由認為這個文件是真身,沒有被改動過。還有些時候,收來 的圖片文件名被改動過了,那麽妳怎麽知道誰是誰呢?這個時候CRC值又起作用了:用專用的軟件對圖片處理後,可以得到文件的大小和CRC值,然後根據大小和CRC值在CSV中尋找是否有適合的圖片。如果有,就會把圖片的名字改成CSV裏的。舉個例子,妳收到了壹張圖片,名字是pic0001.jpg,同時妳知道這張圖片是Sjojo_Rescan這個集子裏面的,但是不知道具體是哪壹張。用軟件得到它的大小和CRC分別是715282和4FB55FE8,那麽軟件在CSV文件裏找到壹行sj_mino1001.jpg,715282,4FB55FE8,大小和CRC都符合,軟件就認為這張圖片的原名是sj_mino1001.jpg,接著自動把文件的名字改成sj_mino1001.jpg。改動的不是CSV文件而是圖片的文件名。接下來的是註釋和說明,可以省略掉。需要註意的是註釋的後面是沒有逗號的,如果要省略註釋的話,壹定要在CRC值的後面保留壹個逗號,否則軟件會把CRC值認為是註釋的。
相信看完上面的壹大堆東西後,妳不但對CSV文件有了個大概地了解,對它的用途應該也有些模糊的概念了吧。我們收集圖片往往是通過各種各樣不同的渠道,比如從網站上,IRC上,抑或幹脆是朋友送的光盤。在整個的傳播過程中,圖片有可能遭受到各種各樣的非人待遇。尤其是從網站上收來的圖片。有些時候僅僅是簡單的改了壹下名字,更多的時候由於很多PLMM站空間有限,常把圖片的尺寸縮小,或者把圖片文件縮小。壹張1356x588的圖被改成了678x294,或者壹個四五百K的文件被縮成了幾十K都是常有的事。比較可惡的是,許多網站把原來掃圖家的Logo去掉,打上自己網站的Logo。還有些許搞笑派的玩家,把各種各樣的圖片移花接木,改頭換面。這些對於壹般的看
圖娛樂無傷大雅,但是對於集圖來說,收到這樣的圖片是無法容忍的。如何驗明圖片的正身,這是掃圖家和集圖者***同面對的問題。CSV文件就是為了解決這樣的問題而出現的。CSV文件最早用在簡單的數據庫裏,由於其格式簡單,並具備很強的開放性,所以起初被掃圖家用作自己圖集的標記。 如上面所說的,CSV文件是個純文本文件,每壹行表示壹張圖片的許多屬性。妳在收壹套圖集時,只要能找到它的CSV文件,用專用的軟件校驗後,妳對該圖集的狀況就可以了如指掌。比如這套圖壹***有多少張,妳收到了多少張,哪些是原圖,那些是可能被改動過或者損壞了的圖片......我們可以把.CSV文件看作壹份索引,妳不但可以“按圖索驥”,還可以檢查自己收來的“馬子”血統是 否純正。
CSV文件的來源通常有兩種:壹種是掃圖家自己發布的CSV,壹般稱作Official CSV。也就是官方發布的CSV,通常說來是有相當的權威性的。比較特殊的是亞洲的許多掃圖家,除了公開發布的圖以外,還有壹些私下發布的Special圖,或者壹些專門送給朋友的圖。加上掃圖家不願意或者不會做CSV,所以他們圖集的CSV往往由集圖界中壹些資深前輩出頭來做。在這種情況下,往往會出現壹個圖集有好幾個版本的CSV文件,並且每個版本之間都有不小的差別。此時的CSV不僅是驗明真身的依據,同時也給了集圖者壹個希望:即使缺的再多,即使用這個版本csv收全的人再少,壹定會有壹個人是全的,就是此CSV的作者!集圖界前輩LiQing有壹句名言:“有CSV就表示壹定有圖!” 自然而然的,民間現了壹些權威的做CSV的玩家。比如早期的EDZONE,現在依然活躍的OSun,shum,vsam,TE,Paul... 還有偶們COC圖盟的WQC
好了,說了那麽多,大家可能會問,CSV文件那麽好用,到底要怎麽用呢?不會要自己手工來檢測吧?呵呵,還記得上文中壹再出現的“軟件”這個字眼嗎?有專用的軟件可以幫助我們完成這項工作。常用的軟件有The!Checker和The Hunter。目前這兩個軟件都有漢化的簡體中文版,漢化人是來自北方的snowtank