您現(xiàn)在的位置：首頁(yè) > IT資訊 > 軟件研發(fā) > 詳解Java開發(fā)工程師在寫SQL程序時(shí)的經(jīng)常性錯(cuò)誤

詳解Java開發(fā)工程師在寫SQL程序時(shí)的經(jīng)常性錯(cuò)誤

2016-09-05 15:26:54　|　來(lái)源：中培企業(yè)IT培訓(xùn)網(wǎng)

對(duì)Java開發(fā)人員來(lái)說(shuō)，SQL這種說(shuō)明性語(yǔ)言而非面向?qū)ο蠡蚴敲钍骄幊陶Z(yǔ)言也讓其開發(fā)成為一大難題。　???中培偉業(yè)《JAVA高級(jí)開發(fā)技術(shù)實(shí)戰(zhàn)》培訓(xùn)專家程老師表示??，??????在SQL中要寫個(gè)查詢語(yǔ)句是很簡(jiǎn)單的，但在Java里類似的語(yǔ)句卻不容易，因?yàn)槌绦騿T不僅要反復(fù)考慮編程范式，而且也要考慮算法的問(wèn)題。程老師在這里就????Java程序員在寫SQL時(shí)常犯的錯(cuò)誤以及相應(yīng)的解決方法進(jìn)行了介紹。　?????????　　1.將NULL拋諸腦后　　Java程序員寫SQL時(shí)對(duì)NULL的誤解可能是最大的錯(cuò)誤。也許是因?yàn)?并非唯一理由)NULL也稱作UNKNOWN。如果被稱作UNKNOWN，這還好理解些。另一個(gè)原因是，當(dāng)你從數(shù)據(jù)庫(kù)拿東西或是綁定變量時(shí)，JDBC將SQL NULL 和Java中的null對(duì)應(yīng)了起來(lái)。這樣導(dǎo)致了NULL = NULL(SQL)和null=null(Java)的誤解。　　對(duì)于NULL最大的誤解是當(dāng)NULL被用作行值表達(dá)式完整性約束條件時(shí)。　　另一個(gè)誤解出現(xiàn)在對(duì)于NULL 在 NOT IN anti-joins的應(yīng)用中。　　解決方法：　　好好的訓(xùn)練你自己。當(dāng)你寫SQL時(shí)要不停得想到NULL的用法：　　這個(gè)NULL完整性約束條件是正確的?　　NULL是否影響到結(jié)果?　　2.在Java內(nèi)存中處理數(shù)據(jù)　　很少有Java開發(fā)者能將SQL理解的很好.偶爾使用的JOIN,還有古怪的UNION,好吧.但是對(duì)于窗口函數(shù)呢?還有對(duì)集合進(jìn)行分組呢?許多的Java開發(fā)者將SQL數(shù)據(jù)加載到內(nèi)存中,將這些數(shù)據(jù)轉(zhuǎn)換成某些相近的集合類型,然后再那些集合上面使用邊界循環(huán)控制結(jié)構(gòu)(至少在Java8的集合升級(jí)以前)執(zhí)行令人生厭的數(shù)學(xué)運(yùn)算.　　但是一些SQL數(shù)據(jù)庫(kù)支持先進(jìn)的(而且是SQL 標(biāo)準(zhǔn)支持的!)OLAP特性,這一特性表現(xiàn)更好而且寫起來(lái)也更加方便.一個(gè)(并不怎么標(biāo)準(zhǔn)的)例子就是Oracle超棒的MODEL分句.只讓數(shù)據(jù)庫(kù)來(lái)做處理然后只把結(jié)果帶到Java內(nèi)存中吧.因?yàn)楫吘顾蟹浅Ｂ斆鞯募一镆呀?jīng)對(duì)這些昂貴的產(chǎn)品進(jìn)行了優(yōu)化.因此實(shí)際上,通過(guò)將OLAP移到數(shù)據(jù)庫(kù),你將獲得一下兩項(xiàng)好處:　　便利性.這比在Java中編寫正確的SQL可能更加的容易.　　性能表現(xiàn).數(shù)據(jù)庫(kù)應(yīng)該比你的算法處理起來(lái)更加快.而且更加重要的是,你不必再去傳遞數(shù)百萬(wàn)條記錄了.　　完善的方法:　　每次你使用Java實(shí)現(xiàn)一個(gè)以數(shù)據(jù)為中心的算法時(shí),問(wèn)問(wèn)自己:有沒有一種方法可以讓數(shù)據(jù)庫(kù)代替為我做這種麻煩事.　　3. 使用UNION代替UNION ALL　　太可恥了，和UNION相比UNION ALL還需要額外的關(guān)鍵字。如果SQL標(biāo)準(zhǔn)已經(jīng)規(guī)定了支持，那么可能會(huì)更好點(diǎn)。　　UNION(允許重復(fù))　　UNION DISTINCT (去除了重復(fù))　　移除重復(fù)行不僅很少需要(有時(shí)甚至是錯(cuò)的)，而且對(duì)于帶很多行的大數(shù)據(jù)集合會(huì)相當(dāng)慢，因?yàn)閮蓚€(gè)子select需要排序，而且每個(gè)元組也需要和它的子序列元組比較。　　注意即使SQL標(biāo)準(zhǔn)規(guī)定了INTERSECT ALL和EXCEPT ALL，很少數(shù)據(jù)庫(kù)會(huì)實(shí)現(xiàn)這些沒用的集合操作符。　　處理方法：　　每次你寫UNION語(yǔ)句時(shí)，考慮實(shí)際上是否需要UNION ALL語(yǔ)句。　　4.通過(guò)JDBC分頁(yè)技術(shù)給大量的結(jié)果進(jìn)行分頁(yè)操作　　大部分的數(shù)據(jù)庫(kù)都會(huì)支持一些分頁(yè)命令實(shí)現(xiàn)分頁(yè)效果，譬如LIMIT..OFFSET,TOP..START AT,OFFSET..FETCH語(yǔ)句等。即使沒有支持這些語(yǔ)句的數(shù)據(jù)庫(kù)，仍有可能對(duì)ROWNUM(甲骨文)或者是ROW NUMBER() OVER()過(guò)濾(DB2,SQL Server2008等)，這些比在內(nèi)存中實(shí)現(xiàn)分頁(yè)更快速。在處理大量數(shù)據(jù)中，效果尤其明顯。　　糾正：　　僅僅使用這些語(yǔ)句，那么一個(gè)工具(例如JOOQ)就可以模擬這些語(yǔ)句的操作。　　5.在java內(nèi)存中加入數(shù)據(jù)　　從SQL的初期開始，當(dāng)在SQL中使用JOIN語(yǔ)句時(shí)，一些開發(fā)者仍舊有不安的感覺。這是源自對(duì)加入JOIN后會(huì)變慢的固有恐懼。假如基于成本的優(yōu)化選擇去實(shí)現(xiàn)嵌套循環(huán)，在創(chuàng)建一張連接表源前，可能加載所有的表在數(shù)據(jù)庫(kù)內(nèi)存中，這可能是真的。但是這事發(fā)生的概率太低了。通過(guò)合適的預(yù)測(cè)，約束和索引，合并連接和哈希連接的操作都是相當(dāng)?shù)目臁＿@完全是是關(guān)于正確元數(shù)據(jù)(在這里我不能夠引用Tom Kyte的太多)。而且，可能仍然有不少的Java開發(fā)人員加載兩張表通過(guò)分開查詢到一個(gè)映射中，并且在某種程度上把他們加到了內(nèi)存當(dāng)中。　　糾正：　　假如你在各個(gè)步驟中有從各種表的查詢操作，好好想想是否可以表達(dá)你的查詢操作在單條語(yǔ)句中。　　6.在一個(gè)臨時(shí)的笛卡爾積集合中使用 DISTINCT 或 UNION 消除重復(fù)項(xiàng)　　通過(guò)復(fù)雜的連接，人們可能會(huì)對(duì)SQL語(yǔ)句中扮演關(guān)鍵角色的所有關(guān)系失去概念。特別的，如果這涉及到多列外鍵關(guān)系的話，很有可能會(huì)忘記在JOIN .. ON子句中增加相關(guān)的判斷。這會(huì)導(dǎo)致重復(fù)的記錄，但或許只是在特殊的情況下。有些開發(fā)者因此可能選擇DISTINCT來(lái)消除這些重復(fù)記錄。從三個(gè)方面來(lái)說(shuō)這是錯(cuò)誤的：　　它(也許)解決了表面癥狀但并沒有解決問(wèn)題。它也有可能無(wú)法解決極端情況下的癥狀。　　對(duì)具有很多列的龐大的結(jié)果集合來(lái)說(shuō)它很慢。DISTINCT要執(zhí)行ORDER BY操作來(lái)消除重復(fù)。　　對(duì)龐大的笛卡爾積集合來(lái)說(shuō)它很慢，還是需要加載很多的數(shù)據(jù)到內(nèi)存中。　　解決方法:　　根據(jù)經(jīng)驗(yàn)，如果你獲得了不需要的重復(fù)記錄，還是檢查你的JOIN判斷吧。可能在某個(gè)地方有一個(gè)很難覺察的笛卡爾積集合。　　7. 不使用MERGE語(yǔ)句　　這并不是一個(gè)過(guò)失，但是可能是缺少知識(shí)或者對(duì)于強(qiáng)悍的MERGE語(yǔ)句信心不足。一些數(shù)據(jù)庫(kù)理解其它形式的更新插入(UPSERT)語(yǔ)句，如MYSQL的重復(fù)主鍵更新語(yǔ)句，但是MERGE在數(shù)據(jù)庫(kù)中確是很強(qiáng)大，很重要，以至于大肆擴(kuò)展SQL標(biāo)準(zhǔn)，例如SQL SERVER。　　解決之道:　　如果你使用像聯(lián)合INSERT和UPDATE或者聯(lián)合SELECT .. FOR UPDATE然后在INSERT或UPDATE等更新插入時(shí)，請(qǐng)三思。你完全可以使用一個(gè)更簡(jiǎn)單的MERGE語(yǔ)句來(lái)遠(yuǎn)離冒險(xiǎn)競(jìng)爭(zhēng)條件。　　8. 使用聚合函數(shù)代替窗口函數(shù)(window functions)　　在介紹窗口函數(shù)之前，在SQL中聚合數(shù)據(jù)意味著使用GROUP BY語(yǔ)句與聚合函數(shù)相映射。在很多情形下都工作得很好，如聚合數(shù)據(jù)需要濃縮常規(guī)數(shù)據(jù)，那么就在join子查詢中使用group查詢。　　但是在SQL：2003中定義了窗口函數(shù)，這個(gè)在很多主流數(shù)據(jù)庫(kù)都實(shí)現(xiàn)了它。窗口函數(shù)能夠在結(jié)果集上聚合數(shù)據(jù)，但是卻沒有分組。事實(shí)上，每個(gè)窗口函數(shù)都有自己的、獨(dú)立的PARTITION BY語(yǔ)句，這個(gè)工具對(duì)于顯示報(bào)告太TM好了。　　使用窗口函數(shù)：　　使SQL更易讀(但在子查詢中沒有GROUP BY語(yǔ)句專業(yè))　　提升性能，像關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)能夠更容易優(yōu)化窗口函數(shù)　　解決方法：　　當(dāng)你在子查詢中使用GROUP BY語(yǔ)句時(shí)，請(qǐng)?jiān)偃紤]是否可以使用窗口函數(shù)完成。　　9. 使用內(nèi)存間接排序　　SQL的ORDER BY語(yǔ)句支持很多類型的表達(dá)式，包括CASE語(yǔ)句，對(duì)于間接排序十分有用。你可能重來(lái)不會(huì)在Java內(nèi)存中排序數(shù)據(jù)，因?yàn)槟銜?huì)想：　　SQL排序很慢　　SQL排序辦不到　　處理方法:　　如果你在內(nèi)存中排序任何SQL數(shù)據(jù)，請(qǐng)?jiān)偃紤]，是否不能在數(shù)據(jù)庫(kù)中排序。這對(duì)于數(shù)據(jù)庫(kù)分頁(yè)數(shù)據(jù)十分有用。　　10. 一條一條的插入大量紀(jì)錄　　JDBC ”懂“批處理(batch),你應(yīng)該不會(huì)忘了它。不要使用INSERT語(yǔ)句來(lái)一條一條的出入成千上萬(wàn)的記錄，(因?yàn)?每次都會(huì)創(chuàng)建一個(gè)新的PreparedStatement對(duì)象。如果你的所有記錄都插入到同一個(gè)表時(shí)，那么就創(chuàng)建一個(gè)帶有一條SQL語(yǔ)句以及附帶很多值集合的插入批處理語(yǔ)句。你可能需要在達(dá)到一定量的插入記錄后才提交來(lái)保證UNDO日志瘦小，這依賴于你的數(shù)據(jù)庫(kù)和數(shù)據(jù)庫(kù)設(shè)置。　　處理方法：　　總是使用批處理插入大量數(shù)據(jù)。

標(biāo)簽： Java開發(fā)