因為有人 留話 在詢問怎麼利用 WPF 處理這些動作,而這些又都是 Microsoft 文件及範例沒有寫的很清楚的部份… 有些範例有提到,但是 Microsoft 內建的 CODEC 正常,3RD PARTY 的 CODEC (像我碰到的 Canon Raw Codec) 就搞半天也搞不出來…。因為之前寫 MediaFiler 正好都碰過這些釘子,就順手寫起來以免以後又忘掉.. :P
講 METADATA 也許會有些人一頭霧水,講 EXIF 搞不好還比較多人知道… EXIF 的規格有點混亂,就像 RSS 一樣,有好幾個派係,Microsoft 乾脆在 WPF 裡跳出來直接稱它做 METADATA,也搭配了 METADATA QUERY LANGUAGE 來避開像 EXIF 一堆必需事先定義好 PROPERTY NAME 的麻煩事…
所以所有的動作都集中在兩件事上面,一個是怎麼操作 METADATA ? 另一個是我要的資料到底藏在那? (你得知道什麼樣的 QUERY 才抓的到你要的資料?)
先看簡單的,貼段 SAMPLE CODE 就搞定了..
SAMPLE 1. 如何讀取 METADATA ?
string srcFile = @"SampleRawFile.CR2";
//
// sample 1. read metadata
// FileStream fs = File.OpenRead(srcFile);
BitmapMetadata metadata = BitmapDecoder.Create(
fs,
BitmapCreateOptions.None,
BitmapCacheOption.None).Frames[0].Metadata as BitmapMetadata;
foreach (string query in queries)
{
object result = metadata.GetQuery(query);
Console.WriteLine("query[{0}]: {1}", query, result);
}
fs.Close();
扣掉 COMMENTS 只有12行… 哈哈,看起來好像也沒什麼好講的,關鍵就只有一個,STREAM別太早關掉…。以前我就吃過虧,試了好久才知道原來是我太雞婆,在第10行之前就把 fs 給關了,後面通通讀不出來…
不過關鍵的 queries (型別是 string[]
),內容到底是啥? 老實說我也不是很清楚 :P 先貼一下建立這字串陣列的 CODE:
建立 CR2 支援的 METADATA QUERY
private static string[] queries = new string[] {
"/ifd/{ushort=256}",
"/ifd/{ushort=257}",
"/ifd/{ushort=258}",
"/ifd/{ushort=259}",
"/ifd/{ushort=262}",
"/ifd/{ushort=270}",
"/ifd/{ushort=271}",
"/ifd/{ushort=272}",
"/ifd/{ushort=273}",
"/ifd/{ushort=274}",
"/ifd/{ushort=277}",
"/ifd/{ushort=278}",
"/ifd/{ushort=279}",
"/ifd/{ushort=282}",
"/ifd/{ushort=283}",
"/ifd/{ushort=284}",
"/ifd/{ushort=296}",
"/ifd/{ushort=306}",
"/ifd/{ushort=315}",
"/ifd/{ushort=34665}/{ushort=33434}",
"/ifd/{ushort=34665}/{ushort=33437}",
"/ifd/{ushort=34665}/{ushort=34855}",
"/ifd/{ushort=34665}/{ushort=36864}",
"/ifd/{ushort=34665}/{ushort=36868}",
"/ifd/{ushort=34665}/{ushort=37377}",
"/ifd/{ushort=34665}/{ushort=37378}",
"/ifd/{ushort=34665}/{ushort=37380}",
"/ifd/{ushort=34665}/{ushort=37386}",
"/ifd/{ushort=34665}/{ushort=37500}",
"/ifd/{ushort=34665}/{ushort=37510}",
"/ifd/{ushort=34665}/{ushort=40960}",
"/ifd/{ushort=34665}/{ushort=40961}",
"/ifd/{ushort=34665}/{ushort=41486}",
"/ifd/{ushort=34665}/{ushort=41487}",
"/ifd/{ushort=34665}/{ushort=41488}",
"/ifd/{ushort=34665}/{ushort=41728}",
"/ifd/{ushort=34665}/{ushort=41985}",
"/ifd/{ushort=34665}/{ushort=41986}",
"/ifd/{ushort=34665}/{ushort=41987}",
"/ifd/{ushort=34665}/{ushort=41988}",
"/ifd/{ushort=34665}/{ushort=41990}",
"/ifd/{ushort=34665}/OffsetSchema:offset"
};
因為我之前處理的目標,是在做轉檔的動作,同時要忠實的把 METADATA 也複製過去,因此得到這列表對我來說很重要,但是搞懂每個項目的意義是啥我就不管了,先列出來再說… 需要的人請自行判斷….
WPF 架構滿分,但是效能多少會打折扣。JPEG實在看不大出來,拿CANON的CODEC來看就很清楚了。如果是以 .CR2 -> .JPG,不作大小的縮放,CANON 自家的 DPP 大概要廿幾秒,CANON自家寫給 WPF 用的 CODEC 搭配 .NET 的 WPF 程式,則要 60 秒左右,測試的機器就我這台 Vista + 4GB RAM, CPU 是 Core2Duo E6300…
速度實在是不快,也不是用 .NET 寫效能太糟的原因,因為 VISTA 內建的秀圖程式也是靠同一個 CODEC,效能也差不多… 不過 CODEC 的架構設計的很好,如果我要的只是縮圖,那就不一樣了… 來看第二個範例:
SAMPLE 2. 建立原圖 (.CR2) 1/10 大小的 JPEG 縮圖
Stopwatch timer = new Stopwatch();
timer.Start();
FileStream fs = File.OpenRead(srcFile);
FileStream fs2 = File.OpenWrite(Path.ChangeExtension(srcFile, ".jpg"));
BitmapDecoder source = BitmapDecoder.Create(fs, BitmapCreateOptions.None, BitmapCacheOption.None);
JpegBitmapEncoder target = new JpegBitmapEncoder();
target.Frames.Add(BitmapFrame.Create(
new TransformedBitmap(source.Frames[0], new ScaleTransform(0.1, 0.1)),
null,
null,
null));
target.QualityLevel = 90;
target.Save(fs2);
fs.Close();
fs2.Close();
timer.Stop();
Console.WriteLine("Create 0.1x thumbnail: {0} ms.", timer.ElapsedMilliseconds);
範例程式也很簡單,扣掉計時的程式碼只有 16 行… 裡面兩個關鍵的參數,分別為第 11 行, 0.1 代表 Scale Transform 用的縮放比例,0.1 就是只要 1/10 的大小。如果你想要固定尺寸的縮圖,得先自行計算出這個 SCALE 的值。要單純的轉檔,就填 1.0 就好。
另一個參數是第15行的 90,它是指存成 JPEG 時要使用的 QUALITY,100 最好,越低失真越嚴重,但是相對的檔案大小也會大幅下降。一般用的 QUALITY 大約都在 75% ~ 90%,其實縮圖 75% 就夠了,反正看不大出來 (H)
我用 CANON G9 拍出來的 RAW (4000 X 3000),存成 400x300 JPEG,約要花費 1.5 秒,比原圖尺寸的 80 秒差太多了,可見 CODEC 一定針對這種需求作過最佳化,會有效避開縮圖時不必讀取的部份資料… 以加快速度。
同樣程式改成不縮圖看看,如果不縮圖的話,ScaleTransform也可以省了,直接把 Frame 加進去就好,原程式的 line 10 ~ line 14,換成這段:
不縮圖的替代程式碼
target.Frames.Add(source.Frames[0]);
嘖,只有一行也在貼… 沒錯,就是這樣而以。跑出來的時間約為 65 秒…
這部份我就沒仔細的拿 DPP 比較過了。不過當你縮圖的尺寸降低時,的確是能有效的加快速度。不過如果對於 ASP.NET WEB 應用程式來看,1.5 秒還是太慢了 @_@,十個人連上來就會想哭了,怎麼辦? 只好善用 CACHE,不然就 買本六月號 RUN PC 看看我投的那篇文章 … 哈哈…
PS: 這篇是寫給對岸的那位愛賞鳥的網友看的,希望有解決到你的問題。完成後也記得給我欣賞一下你們的攝影作品 :D
PS2: 範例程式放在這裡,請自行 下載。圖檔請放同目錄的 SampleRawFile.CR2 PS3: 家裡大人不准我買 PS3 …
自從搬到 BlogEngine.NET 之後,每天晚上都沒閒著,一點一點的慢慢把整個網站改成我要的樣子... 資料庫 / 檔案是我最在意的,當然要優先顧好,光這部份就花了一個多禮拜...
最早找到了 CS2007 --> BlogML --> BlogEngine,大概把我想要的 90% 資料都轉過來了,不過看到那 10% 的資訊沒過來,心裡就很不是滋味...
"這是我要一直保留下來的資料耶,現在沒把資料補回來,以後就永遠補不回來了..."
就是心裡一直這樣想,所以... 重匯吧! 不然以後後悔也是補不回來的。首先當然是想先從 BlogEngine 匯入 BlogML 的工具下手,看了一下,沒提供 Source Code ? 再看一下,一篇文章一個 Web Service Call,一則回應也是一個 Web Service Call ... 感覺起來有點沒效率,不過不管了,我內容也不多 (兩百多篇文章) ... 既然有 Web Services,先看看它的 WSDL ...
http://columns.chicken-house.net/api/blogImporter.asmx
沒幾個 WebMethod 嘛,不過看一看它的 Interface 就已經漏掉很多資訊沒轉進來了 (像是我要的原 CS PostID,事後作新舊網址對照表用,還有 PageViewCount... etc),要改原程式也是個大工程,不但 CLIENT 要改,WEB METHOD 也要擴充... 我又不是非得遠端用 WEB SERVICES 執行匯入不可,就當下決定另外寫一個匯入程式還比較快...。重寫的話就得研究它的寫法,正好每個 WebMethod 都只作單一的動作,裡面的實作就是現成的範例... 省了不少熟悉 API 的時間 :P
事後證明這作法沒錯,BlogEngine 的 LIB 蠻簡單易懂的,另外寫真的比較快... 就一切以原 .ASMX 的程式碼為藍本,寫了一個 .ASHX ,不作什麼事,就是把事先放在 ~/App_Data 下的 BLOGML 讀進來,一篇一篇 POST 處理,一個一個回應處理... 兩層迴圈就搞定原本那 90% 的匯入作業...
接下來就是自訂的部份了。先來列一下那些是我要補的資訊:
源頭就有東西要補了。如果一切基於 BlogML 的話,BlogML 沒定義到的資料就沒機會撈出來了。看了一下我還需要額外抓出來的資訊,像匿名的 COMMENTS 作者資訊,IP 等... 不過這些都用某種序列化的方式存在 CSDB,ㄨ!! 真麻煩... 在 CS2007 DB 內的 [cs_posts] 有這兩個欄位: PropertyNames, PropertyValues... 沒錯,全部壓成一個大字串,得自己寫程式去 PARSE ...
CS2007 的作法是這樣,在 PropertyNames 欄位放的值長的像這樣 (包含 Name, 型別, 字串起始及結束位置):
SubmittedUserName:S:0:3:TitleUrl:S:3:35:
而在 PropertyValues 對應的值為:
小熊子http://michadel.dyndns.org/netblog/
拆起來有點小麻煩,PropertyNames 是 {Name}:{Type}:{StartPos}:{EndPos}: 的組合,有多組的話就一直重複下去。以 Comments 的 SubmittedUserName 來說,它的型別是 S ( String ),它的值就要從後面的 PropertyValues 整個字串的第 0 個字元 ~ 第 3 個字元之間的值 ( 小熊子 ),而 TitleUrl 則是第 3 個字元 ~ 第 35 個字元的值 ( http://michadel.dyndns.org/netblog/ ) ...
看來用 T-SQL 拆或是用 XPath / XSLT 拆都有點辛苦,想想算了... 這段 CODE 跑不掉一定要寫... 就硬解出來吧。解出來後就可以修正 CS2007 匿名張貼的 Comment 沒正確顯示在 BlogML 內的問題。
接下來要把 SQL 這堆資料倒成 XML 檔,偷吃步一下,找工具直接倒出來就好。反正只作一次,可以不要寫 CODE 就不要寫了... SQL2005 要把 QUERY 結果存成 XML 倒是很簡單,打開 SQL2005 Management Studio, 執行這段 QUERY:
1: select
2: PostID,
3: PostAuthor,
4: PropertyNames,
5: PropertyValues
6: from cs_posts
7: where ApplicationPostType = 4
8: for xml auto
會看到這樣的畫面:
點下去就是 XML 了,手到加上頭尾的 Root Element 存檔就搞定了。接下來補段 CODE 把我要的 Property 拆出來存 XML 檔,第一步驟收工!
接下來這堆問題就以 (4) 最麻煩了。原本想的很天真,用文字編輯器把所有 XML 檔替換掉就沒事... 錯! 先從最單純的圖檔路逕來看吧..
[替換圖檔及下載檔案的網址]
最基本的就是圖檔網址... 在 CS2007 裡圖檔是這樣放的 (WLW會幫你補上絕對路逕,不是用相對路逕)
http://columns.chicken-house.net/blogs/chicken/xxxxxxx/xxx.jpg
而看了 BlogEngine 的作法,它用 HttpHandler 的方式來提供前端下載圖檔,格式像這樣:
http://columns.chicken-house.net/xxxxx/wp-content/be-files/xxx.jpg
而 BlogEngine 的設定檔是這樣寫的:
1: <httpHandlers>
2: <add verb="*"
3: path="file.axd"
4: type="BlogEngine.Core.Web.HttpHandlers.FileHandler, BlogEngine.Core"
5: validate="false"/>
6: <add verb="*"
7: path="image.axd"
8: type="BlogEngine.Core.Web.HttpHandlers.ImageHandler,
9: BlogEngine.Core"
10: validate="false"/>
11: .....
12: </httpHandlers>
看起來不難,理論上我只要找到原網址,把 ~/blog/chicken/ 後的路逕切出來,前段改成 image.axd?picthre= 就可以了。
大致上是這樣沒錯,不過變數還不少... 因為有好幾種網址 @_@
代換要嘛一次做完,要嘛一定要照 1 2 3 順序,否則先做 (3) 就會把 (1) (2) 都破壞掉了... 但是怎麼想程式都很不乾脆,雜七雜八的 CODE 一堆... 最後搬出 http://regexlib.com/ 這個網站,它提供大量的 Regular Expression 的資料庫供你使用,也提供了線上版本讓你測試 MATCH 的結果,很好用! 一定要推一下...
最後定案的 Regular Expression 長這樣:
(http\://(columns|community)\.chicken\-house\.net)?/blogs/chicken/([a-zA-Z0-9\-_\./%]*)
一切都很順利,簡單的就精確的抓到要代換的範圍。補一下小插曲,最後轉完才發現漏掉 (4),不過沒幾篇,就手動改掉了 :P,所以這段 REGEXP 是沒處理到 (4) 這種情況的...
[站內連結的修正]
再來就開始麻煩了... 動手前我先想了一下,每篇文章要匯進去後才會知道它的新 ID,新網址... 在還不知道新網址之前有些內容的聯結就無法替換了,怎麼樣都不可能在 1 PASS 內解決這問題... 只能用 2 PASS 來處理了。
既然這樣,第一次匯入就不修站內聯結了,只要把新舊 ID 記下來就好...
頭痛的來了,CS2007 的網址格式有好幾種 @_@ (難怪它有專門一個 config 檔來設定幾十個 URL Rewrite 的設定...):
其中 1234 是 CS2007 內部使用的 PostID . 再看看 BlogEngine 的網址格式:
還好 BlogEngine 單純多了,只要抓到 (1) 的 ID,SLUG 就有 API 抓的到...
記得 CS 網址還有不需要 URL Rewrite 的版本 ( /blogs/xxxxx.aspx?postID=1234 這樣),不過從來沒出現在我文章內容,就不理它了...
這裡的重點不是單純的代換了,還要精確的抓出 1234 這段 PostID .. 最後定案的 Regular Expression 長這樣:
(http\://(columns|community)\.chicken\-house\.net)?/blogs/chicken/archive/\d+/\d+/\d+/(\d+)\.aspx
果然人家說 Regular Expression 是 "WRITE ONLY LANGUAGE" 真有道理,寫完連我自己都看不懂這堆符號是在幹嘛... 最後新舊 ID 都抓到就可以產生出正確的新站內連結了..
[站外連結修正]
我自己的 LINK 找到就可以修,不過寫在別人那邊的我那修的到啊... 因此就要靠上一篇講的,想辦法要去接有人點到舊的 CS LINK,然後當場做轉址的動作...
好在舊的文章不會再變多了,靠前面做出來的對照表就有足夠的資訊了... 成果看上一篇就知道了。這裡主要是靠 CSUrlMap.cs 這個我自己寫的 HttpHandler 來解決所有連到 /blogs/*.aspx 的連結...
方法差不多,我得從各種可能的網址格式,抓出舊的 CS PostID,然後查表,找出新的網址,把使用者引導到新的頁面... 貼一下主程式的部份:
1: public void ProcessRequest(HttpContext context)
2: {
3: if (matchRss.IsMatch(context.Request.Path) == true)
4: {
5: // redir to RSS
6: context.Response.ContentType = "text/xml";
7: context.Response.TransmitFile("~/blogs/rss.xml");
8: }
9: else if (matchPostID.IsMatch(context.Request.Path) == true)
10: {
11: // redir to post URL
12: Match result = matchPostID.Match(context.Request.Path);
13: if (result != null && result.Groups.Count > 0)
14: {
15: string csPostID = result.Groups[result.Groups.Count - 1].Value;
16: if (this.MAP.postIDs.ContainsKey(csPostID) == true)
17: {
18: context.Items["postID"] = this.MAP.postIDs[csPostID];
19: context.Items["redirDesc"] = "網站系統更新,原文章已經搬移到新的網址。";
20: }
21: else
22: {
23: context.Items["redirDesc"] = "查無此文章代碼,文章不存在或是已被刪除。將返回網站首頁。";
24: }
25: }
26: else
27: {
28: context.Items["redirDesc"] = "4444";
29: }
30: }
31: else if (matchPostURL.IsMatch(context.Request.Path) == true)
32: {
33: context.Items["postID"] = this.MAP.postURLs[context.Request.Path];
34: context.Items["redirDesc"] = "網站系統更新,原文章已經搬移到新的網址。";
35: }
36: else
37: {
38: context.Items["redirDesc"] = "查無此頁。將返回網站首頁。";
39: }
40: context.Server.Transfer("~/blogs/AutoRedirFromCsUrl.aspx");
41: }
看程式說故事,大家都會吧 :D,結果就是上一篇各位看到的樣子... 已經沒力一行一行再說明下去了 :P
寫到這邊真是大工程 @_@,動作都不困難,但是都是雜七雜八的工作,害我搞了一個禮拜... 不過到此為止搬家要處理的資料部份全部都完成了。下一篇就輕鬆多了,把網站的版面調整成我想要的樣式... 有興趣的人請多等一等吧 :D 主題會放在跟 FunP 推推王的密切整合上... 敬請期待 :D
原本是把舊的訂閱網址都自動轉過來了, 不過想想這不是好方法, 舊的網址得一直掛在那邊.. 沒換的人一年後還是不會換, 因此還是提醒一下.
大概就是這樣, 請大家繼續支持, 換到新網站, 繼續訂閱吧 :D
哈,不是我要搬家了,是網站搬家... 搬家是想了很久沒錯,只是決定搬到 BlogEngine.Net 倒是沒花幾天的時間,所以準備動作也是有點 LiLiLaLa .. 從 CommunityServer 這種成熟的系統搬到還很年輕的 BlogEngine.Net,其實碰到不少小麻煩,在這裡記錄一下給需要的人參考,也算功德一件!
要搬 BLOG,最直覺的就是用 BlogML 了,不錯,我用的 CommunityServer2007 有工具可以匯出 BlogML,而 BlogEngine.Net 也有工具可以匯入 BlogML,想想真是太好了... 就先用 DevWeb 架了 BlogEngine.Net 起來試搬看看..
BlogEngine.Net 匯入的方式,是用 ClickOnce,直接從它的官方網站下載的 WinForm App 配合 BlogEngine.Net 本身提供的 Web Service 來進行匯入 BlogML 的動作,除了 BLOGML 之外也支援 RSS? 不過 RSS 怎麼試都試不出來,放棄... 直接用 BlogML ...
畫面很乾淨,它也很忠實的完成了它的工作... CommunityServer2007 的 BLOGML 匯入時出了點問題,文章的修改時間不知為何,BlogEngine.Net 都一直抓到 0000/01/01 00:00:00.000 ,而BlogEngine.Net 還會幫你修正時區的問題 (台灣時區,要 -8 小時才是標準時間),結果一扣就變成負的,就送我一個 Exception ... Orz
匯入的第一步就得動用到 Visual Studio 2008,真不是好兆頭... 所性拿掉那行程式,就一切沒問題了,順利匯入! 架了台測試網站,研究了一兩天,實在是有點不滿意...
上面這幾點,都是搬家時或多或少會碰到的小問題,不過很想哭的是,這六個最後都是搬出 Visual Studio 2008 出來才搞定的 @_@,什麼意思? 就是自己寫 CODE 來修啦... 真不知道該誇還是該罵,也因為這樣有機會 Trace 幾次它的 Code,忍不住想再誇它一次,要建起開發環境實在太容易了 [H] 哈哈... 它的 CODE 很精實,CODE 不多,架構很好,規規舉舉的很容易懂,這種 CODE 改起來真舒服.. (為什麼公司的 CODE 都沒有像這種的...),修改的難度大概只有 CommunityServer 的 1/3 .. (CommunityServer的作者很猛,把 Microsoft 在 2.0 才推出的那套架構在 1.1 時代就都實做了一套 [Y])
現在還有空在這裡慢慢打,當然是這些問題都解決完了,先看看成果吧,細節有空再補 HOWTO 文章。那些 LINK 不對的問題,各位翻翻舊文章,如果都看的到圖點的到東西,就是沒問題了。有問題的請再留話給我,我來修看看。
來看看加上 Google Ads 的版面,老實說這個版跟 Google Ads 還真搭... 看起來就像同一套的.. 我只調了 CSS ,跟 MASTER PAGE..
再來是站內文章互連的 LINK。這邊讓我傷了幾秒鐘的腦筋... 就放棄原本只想寫寫批次檔代換的念頭了。轉檔前跟本不知道轉檔後的新 LINK 是長什麼樣子,轉檔後就錯失先改好 BLOGML 再匯入的機會了... 想了一下,無解,一定要動用到 2 PASS 才行... 就乖乖的改轉檔程式了。第一輪就是基本的匯入,然後在原本的 BLOGML 附記新的 LINK 及 BlogEngine.Net 的 PostID,然後 PASS 2 再把舊文章逐一翻出來 SEARCH & REPLACE ... 上圖可以看到,內文 [四核 CPU] 的 LINK (在底下) 就已經是修正過的了,各位可以去試看看...
再來是站外的 LINK,站內我自己的可以改,站外可沒辦法... 拿最捧我場的 Darkthread 網站為例,搜尋一下就有七八篇是連到我這邊,怎麼可以辜負大人的好意... 動搖國本也要改! 現在我的 BlogEngine.Net 已經可以接受舊系統的網址了,而且會正確的轉到同一篇文章的新網址。不過為了不讓大家 "不知不覺" 就轉過來,我特地加了一頁提示,因為書上教的,不要把錯誤隱藏起來 :D,你可以用防禦性的方式寫 CODE,但是務必加上 ASSERT 及 TRACE 提醒自己這裡要注意... (出自一本古董書: Writing Solid Code... 太古董了實在找不到 LINK ... )
就挑這篇來示範吧,黑暗大哥的文章裡有個 LINK,存的是舊的 CommunityServer 格式 URL,點下去之後會跳到我的網站...
倒數完或是你沒耐性直接按下去的話,就會跳到這篇文章... BINGO,原本的內容出現了!
嗯,總算修正回來了。其實修正網址是搬家最頭痛的問題了,這個搞定其它都好說 :D 留給有興趣想從 CommunityServer 搬家到 BlogEngine.Net 的人參考...
(小熊子別再撐了... 還有那個誰也是一樣...)
哈,不是指 Final Fantasy 3 ... 是指 Firefox 3, 今天是 Firefox 3 下載日,看看能不能創下單日內最高的下載次數世界紀錄... 我其實都用 IE 用慣了,也不趕著一定要今天下載,不過既然有世界紀錄,當然要來湊個熱鬧... :D
貼張照片紀念一下,以後可以跟小皮說 "這個世界紀錄你老爸也有算一份..."