首頁 > 精品范文 > 數(shù)據(jù)庫論文
時間:2023-03-17 18:06:04
序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內(nèi)心深處的真相,好投稿為您帶來了七篇數(shù)據(jù)庫論文范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創(chuàng)作。
【摘要題】實踐研究
1調(diào)查情況介紹
為了配合中國高等教育文獻保障系統(tǒng)(CALIS)“十五”期間的建設(shè)和中國高等學校數(shù)字圖書館聯(lián)盟(CADLA,下稱聯(lián)盟)工作的開展,2002年4月,CALIS在成員館中間發(fā)放了《數(shù)字圖書館建設(shè)情況調(diào)查表》;2002年5月和6月在聯(lián)盟理事館(注:目前中國高等學校數(shù)字圖書館聯(lián)盟理事館都是CALIS成員館。)中間發(fā)放了《學位論文數(shù)據(jù)庫建設(shè)情況調(diào)查表》和《教學參考書數(shù)據(jù)庫情況調(diào)查表》。
截至2002年6月30日,共回收《數(shù)字圖書館建設(shè)情況調(diào)查表》89份,其中書面報告22份,電子版報告67份。這些調(diào)查報告中有29份來自綜合性院校,34份來自工科院校,9份來自人文社會科學類院校,來自其他專業(yè)性院校,如醫(yī)學類院校、農(nóng)林院校和師范類院校的報告分別為5份、4份和6份。圖1給出對提交調(diào)查報告的學校按地區(qū)進行統(tǒng)計得到的結(jié)果。根據(jù)統(tǒng)計數(shù)字和圖表可以看到,此次在CALIS成員館中進行的數(shù)字圖書館建設(shè)情況調(diào)查具有一定的代表性,比較全面地反映了高校數(shù)字圖書館建設(shè)的整體情況。
圖1提交調(diào)查報告的學校按地區(qū)統(tǒng)計的結(jié)果
對于在22個聯(lián)盟理事館中間進行的“學位論文數(shù)據(jù)庫建設(shè)情況”和“教學參考書數(shù)據(jù)庫情況”重點調(diào)研,各單位均及時對調(diào)查內(nèi)容進行了反饋。
針對上面的三份調(diào)查,本文第二部分從幾個主要方面對各成員館數(shù)字圖書館建設(shè)情況進行了分析總結(jié);第三部分給出CALIS在“十五”期間將要建設(shè)的兩個子項目“高校學位論文全文數(shù)據(jù)庫”和“教學參考書數(shù)據(jù)庫”在成員館中間開展的情況;最后對目前成員館數(shù)字圖書館建設(shè)中急需解決的主要問題進行匯總。
2整體分析
通過CALIS的宣傳和培訓,大部分成員館意識到開展數(shù)字圖書館建設(shè)的必要性和重要性。調(diào)查結(jié)果顯示,在2000年前后成員館根據(jù)各自對數(shù)字圖書館的理解、現(xiàn)有基礎(chǔ)、階段性工作重點、人員情況,開始從專業(yè)性或校園范圍的文獻信息保障體系、數(shù)字圖書館應(yīng)用系統(tǒng)、數(shù)字資源、基礎(chǔ)設(shè)施等各方面進行建設(shè),全面推動圖書館向電子化、數(shù)字化方面發(fā)展,并在資金投入力度方面予以重視。
2.1專業(yè)性、校園范圍的文獻保障體系
眾所周知,CALIS在“九五”期間建設(shè)了三級文獻信息保障體系。四個全國中心、七個地區(qū)中心分別構(gòu)成文獻信息保障體系的第一級和第二級,在全國和地區(qū)范圍內(nèi)行使文獻信息保障功能。但是由于人力、物力、財力的原因,這些中心還不能滿足所有高校圖書館和用戶的全部需要。根據(jù)本次調(diào)查的結(jié)果,目前有10個學校正在開展專業(yè)性或校園范圍內(nèi)的文獻信息保障系統(tǒng)建設(shè)。其中北京師范大學圖書館正在構(gòu)造有一定規(guī)模的“中文教育數(shù)字圖書館”,將分布于國內(nèi)外的中文教育資源納入統(tǒng)一的檢索系統(tǒng);上海財經(jīng)大學圖書館在數(shù)字圖書館理念以及相應(yīng)的管理機制等方面進行了研究與實踐,提出了建設(shè)“財經(jīng)文獻資源信息中心”的設(shè)想;電子科技大學圖書館“西南地區(qū)電子信息學科與文獻信息中心”的建設(shè)已具雛形;首都師范大學圖書館和北京工業(yè)大學圖書館受北京市教委的委托籌建了“北京高校網(wǎng)絡(luò)圖書館”;內(nèi)蒙古大學圖書館“多功能蒙古學文獻信息研制服務(wù)中心”的建設(shè)頗具民族特色;安徽大學、北京理工大學、大連海事大學、福州大學、哈爾濱工業(yè)大學的圖書館,依托校園網(wǎng)建立與本校學科發(fā)展、人才培養(yǎng)相配套的,以信息服務(wù)為重心的全方位、多層次、高效率的文獻信息服務(wù)體系。
2.2數(shù)字圖書館應(yīng)用系統(tǒng)
考慮圖書館的工作特點,針對圖書館的需要,研究和開發(fā)數(shù)字圖書館建設(shè)中急需的各種應(yīng)用系統(tǒng),已經(jīng)被列入各成員館的計劃中。本次調(diào)查發(fā)現(xiàn)有16個圖書館正在應(yīng)用系統(tǒng)方面進行技術(shù)攻關(guān)。其中開展數(shù)字圖書館原型試驗系統(tǒng)研發(fā)的學校主要有北京大學、復(fù)旦大學、西安交通大學、廈門大學、中山大學、武漢大學等高校的圖書館,這些圖書館研制的內(nèi)容包括數(shù)字圖書館體系結(jié)構(gòu)、元數(shù)據(jù)、信息存儲與檢索、互操作等相關(guān)技術(shù)與解決方案;上海交通大學、北京大學、北京航空航天大學等10余所高校圖書館開發(fā)了“視頻點播系統(tǒng)”,采用大容量存儲設(shè)備存儲多媒體資料在校園網(wǎng)內(nèi)提供多媒體視頻、音頻資料的網(wǎng)上實時點播;復(fù)旦大學圖書館正在開發(fā)“圖書館電子資源跨平臺檢索系統(tǒng)”,實現(xiàn)統(tǒng)一界面查詢,讀者可以通過書刊名、文章名、關(guān)鍵詞、著者、媒介類型、數(shù)據(jù)來源等檢索項(包括組合檢索項),查詢系統(tǒng)連接的各個數(shù)據(jù)庫;天津大學、廈門大學、西北師范大學等7所高校圖書館專門成立了“特色資源數(shù)字化加工中心”,開展紙本文獻數(shù)字化、多媒體資源加工、電子剪報、數(shù)據(jù)庫制作的相關(guān)硬件環(huán)境設(shè)備建設(shè)及軟件支撐平臺建設(shè),形成數(shù)字化資源的收集、加工、分類標引、整合、、更新、維護等的完整系統(tǒng);電子科技大學圖書館開發(fā)了“專題數(shù)據(jù)庫系統(tǒng)”,為圖書館的數(shù)據(jù)庫建設(shè)提供平臺,包括開發(fā)、分類、全文檢索、遠程查詢、科學管理和升級等功能,能全面、準確、高效地達到網(wǎng)絡(luò)化數(shù)據(jù)庫系統(tǒng)的應(yīng)用標準;吉林大學、中國人民大學圖書館利用相關(guān)技術(shù),建立了標準化的知識服務(wù)系統(tǒng)平臺,開發(fā)了“服務(wù)子系統(tǒng)”,為用戶提供個性化服務(wù),包括信息定制、協(xié)作咨詢、知識挖掘、多媒體教學、VOD點播、重點學科導航等;西安交通大學圖書館正在集中力量,依托CALIS西北地區(qū)中心搭建一個統(tǒng)一的軟硬件平臺,建設(shè)地區(qū)性數(shù)字資源中心、數(shù)字化中心、存儲中心、交換中心以及數(shù)字圖書館研究與開發(fā)中心,為用戶提供集成化的智能服務(wù)。
2.3數(shù)字資源建設(shè)
資源建設(shè)是數(shù)字圖書館建設(shè)的基礎(chǔ),也是各館開展數(shù)字圖書館嘗試的主要選擇。“九五”期間在CALIS的宏觀調(diào)控和統(tǒng)一規(guī)劃下,一方面,各館大幅度增加電子文獻的引進,以網(wǎng)絡(luò)版數(shù)據(jù)庫為主,并引進部分光盤數(shù)據(jù)庫;另一方面,各館在自建資源方面取得了很大的突破,CALIS組織成員館共同建設(shè)了聯(lián)合目錄數(shù)據(jù)庫、中文現(xiàn)刊目次庫、學位論文文摘庫等數(shù)據(jù)庫。在提交調(diào)查報告的89所圖書館中,85%以上的圖書館參與了CALIS“九五”期間的子項目建設(shè),在支持CALIS資源建設(shè)工作的同時推動本館的數(shù)字化進程,起到了事半功倍的效果。
與此同時,CALIS有選擇性地支持24個單位根據(jù)本館的特色館藏、資源特性,在網(wǎng)絡(luò)環(huán)境下建立特色館藏,逐步把有價值的特色信息資源組織起來,建設(shè)成CALIS重點學科專題數(shù)據(jù)庫,以便比較集中、更深層次地揭示各高校收集的富有學科特色的文獻。目前CALIS重點學科專題數(shù)據(jù)庫包括24家成員館建成的25個重點學科專題數(shù)據(jù)庫,數(shù)據(jù)量已達280萬條以上,通過因特網(wǎng)進行服務(wù),實現(xiàn)資源共享。
在CALIS的帶動下,在24家成員館的示范作用下,為了更好地滿足本校教學科研的需要,其他的CALIS成員館紛紛開展本館特色資源的調(diào)研、論證和建設(shè)工作。本次調(diào)查統(tǒng)計結(jié)果顯示,目前正在進行數(shù)據(jù)庫建設(shè)的CALIS成員館有74所,每個館根據(jù)各自的條件和實力,或者百花齊放,如中山大學、西安交通大學、上海交通大學等17所高校圖書館同時進行幾個數(shù)據(jù)庫的建設(shè);或者一支獨秀,在數(shù)據(jù)庫建設(shè)的質(zhì)量上下功夫。
成員館自建的這些數(shù)據(jù)庫圍繞著CALIS制定的“建設(shè)具有中國特色、地區(qū)特色和高等教育特色的專題數(shù)據(jù)庫”的原則,或者對館藏特色文獻數(shù)字化,或者做某個學科或?qū)n}的數(shù)字資源建設(shè)工作,比較系統(tǒng)全面地對某個專題進行綜合報道。數(shù)據(jù)庫各具特色,有的體現(xiàn)中國文化淵源歷史,有的介紹人物生平、業(yè)績、著作,有的針對某個學科或?qū)I(yè)做全面的介紹,有的展現(xiàn)科技動態(tài)。數(shù)據(jù)庫形式多樣,包括圖象、文字、解說、全文和文摘,具有學科知識數(shù)據(jù)庫的特點。揭示的內(nèi)容比普通二次文獻庫要深,豐富了高校資源。數(shù)據(jù)庫內(nèi)容豐富,包含中外文期刊、會議論文、專利文獻、產(chǎn)品、事實數(shù)據(jù)、研究機構(gòu)信息,或集各種信息于一體。有的數(shù)據(jù)庫具備良好的檢索系統(tǒng),提供WEB界面的查詢,有些還使用全文檢索系統(tǒng)和多媒體系統(tǒng),可提供全文、關(guān)鍵詞、題名、出處、文摘等多檢索點檢索;為配合學校的教學和科研,為推廣高校科學技術(shù)成果,展示廣大科研人員的勞動成果和聰明才智,給廣大讀者提供豐富的有價值的科研資料做出了積極的貢獻,彌補了圖書館經(jīng)費緊缺造成的紙本資源的不足,為高校數(shù)字圖書館的工作積累了豐富的經(jīng)驗和技術(shù)。
2.4基礎(chǔ)設(shè)施建設(shè)
基礎(chǔ)設(shè)施建設(shè)是各館進行數(shù)字圖書館建設(shè)的一個重要部分。調(diào)查發(fā)現(xiàn),有28所圖書館正在從基礎(chǔ)設(shè)施建設(shè)入手,創(chuàng)造數(shù)字圖書館的基本環(huán)境。其中22所圖書館對本館的自動化和網(wǎng)絡(luò)系統(tǒng)進行了升級與改造,旨在建立先進可靠的高速信息網(wǎng)絡(luò)系統(tǒng),建設(shè)先進的圖書館集成管理系統(tǒng),實現(xiàn)圖書館日常業(yè)務(wù)科學全面的自動化管理,為國內(nèi)外資源共享提供環(huán)境;9所學校建設(shè)了多功能電子閱覽室、多媒體教學、網(wǎng)絡(luò)培訓教室,提升了圖書館的開發(fā)和應(yīng)用能力,為師生提供多媒體信息服務(wù);北京理工大學、北京化工大學等4所院校還斥資數(shù)千萬建設(shè)了新館舍,給師生提供了舒適的教學科研環(huán)境。
2.5資金支持
《數(shù)字圖書館建設(shè)情況調(diào)查表》中還包括對各個學校用于數(shù)字圖書館建設(shè)的資金額度及其來源的調(diào)查。調(diào)查結(jié)果顯示各成員館數(shù)字圖書館的建設(shè)資金分別來源于“211工程”建設(shè)經(jīng)費“985”工程,國家“教育振興行動計劃”,國家和省級自然科學基金,各省市教委、學校的專項撥款,與企業(yè)共建,捐助,圖書館年運作經(jīng)費,學校自籌等10多個方面。由此可見圖書館動用了所有力量,通過各種渠道支持數(shù)字圖書館建設(shè)。小到學校,大到國家,建設(shè)數(shù)字圖書館的意識都明顯增強,對此投入的資金大幅度增加,部分學校得到的數(shù)字圖書館建設(shè)的資金更是令人可喜。表1將各館數(shù)字圖書館經(jīng)費情況按幾個等級進行了統(tǒng)計。需要說明的是有17個學校未對數(shù)字圖書館資金的投入進行說明,無法進行統(tǒng)計。對72個成員館的統(tǒng)計結(jié)果顯示,38.9%的學校數(shù)字圖書館建設(shè)的資金額度大于100萬,其中有8.3%的高校十分重視數(shù)字圖書館的建設(shè),投入了數(shù)千萬資金支持數(shù)字圖書館的建設(shè),但是,我們還應(yīng)該看到,有超過一半的圖書館用于數(shù)字圖書館建設(shè)的資金小于10萬,無力開展規(guī)模性的、目的明確的數(shù)字圖書館建設(shè)活動。“十五”期間,為了在更大范圍內(nèi)共建、共知、共享,CALIS任重道遠。
表1數(shù)字圖書館建設(shè)資金狀況統(tǒng)計
3重點調(diào)研
下面根據(jù)聯(lián)盟理事館對《學位論文數(shù)據(jù)庫建設(shè)情況調(diào)查表》和《教學參考書數(shù)據(jù)庫情況調(diào)查表》的反饋意見,綜合CALIS成員館對《數(shù)字圖書館建設(shè)情況調(diào)查表》的反饋意見,對CALIS成員館“學位論文數(shù)據(jù)庫”和“教學參考數(shù)據(jù)庫”的建設(shè)情況進行分析。
3.1學位論文全文數(shù)據(jù)庫建設(shè)
“高校學位論文文摘數(shù)據(jù)庫”是CALIS“九五”建設(shè)的一項重要成果,是高校間開展文獻傳遞的重要基礎(chǔ)數(shù)據(jù)庫之一。“九五”期間共有90余所成員館參與了CALIS學位論文文摘數(shù)據(jù)庫的建設(shè),學位論文文摘數(shù)據(jù)提交量已經(jīng)達到10萬條。由于學位論文內(nèi)容豐富、新穎、情報價值高,對某一專題有獨到的見解和系統(tǒng)論述,對科研和生產(chǎn)有較大參考價值,讀者需求呈上升趨勢,為此,“十五”期間,CALIS將在該庫的基礎(chǔ)上進一步建設(shè)“高校學位論文全文數(shù)據(jù)庫”,全面實現(xiàn)博、碩士學位論文資源的共享。根據(jù)《數(shù)字圖書館建設(shè)調(diào)查》和《高校學位論文全文數(shù)據(jù)庫建設(shè)調(diào)查》的統(tǒng)計結(jié)果,CALIS成員館中有29家開展了學位論文全文數(shù)據(jù)庫的籌備和建設(shè)工作,其中13家來自聯(lián)盟理事館;目前這些學校學位論文的全文數(shù)據(jù)加起來有18100條,主要采用WORD和PDF格式保存,也有個別學校采用JPG格式和DJVU格式;其中北京大學、上海交通大學和東南大學圖書館學位論文建設(shè)工作開展較早,可以追溯到1996年;北京大學、清華大學和西安交通大學圖書館數(shù)據(jù)庫建設(shè)規(guī)模較大,有超過5000條的全文數(shù)據(jù);已經(jīng)具有學位論文數(shù)據(jù)庫提交系統(tǒng)的學校有11個,其中北京大學、清華大學等圖書館的系統(tǒng)已經(jīng)比較成熟,不僅具有學位論文提交系統(tǒng),而且同時開發(fā)了學位論文檢索系統(tǒng),并考慮了學位論文的編目、校驗、統(tǒng)計,設(shè)計了學位論文管理系統(tǒng);目前北京大學和西安交通大學圖書館的學位論文數(shù)據(jù)庫系統(tǒng)是開放的,讀者可以檢索到摘要級,其他學校的學位論文系統(tǒng)有的要進行用戶認證,有的通過IP限制訪問;對于學位論文的版權(quán)問題,各個學校還沒有很好的解決方案。比較實際的解決方法是和論文作者簽署論文使用協(xié)議,限于校園網(wǎng)使用。成員館的上述工作為“十五”期間CALIS學位論文全文數(shù)據(jù)庫的建設(shè)提供了很好的基礎(chǔ)。2002年5月底,CALIS管理中心邀請在學位論文建設(shè)方面有一定基礎(chǔ)的15個聯(lián)盟理事館召開了“高校學位論文全文數(shù)據(jù)庫建設(shè)工作研討會”。會議統(tǒng)一了對高校學位論文全文數(shù)據(jù)庫建設(shè)的認識,明確了高校學位論文全文數(shù)據(jù)庫建設(shè)的指導思想為在統(tǒng)一的建庫標準規(guī)范下,實現(xiàn)共建、共享。會上大家總結(jié)出學位論文建設(shè)的主要環(huán)節(jié)包括總體工作流程、標準規(guī)范、論文提交、應(yīng)用系統(tǒng)、管理與版權(quán)等。會后,CALIS管理中心根據(jù)各成員館的意見,整理了《高校學位論文全文數(shù)據(jù)庫建設(shè)參考》,為其他準備開展學位論文全文數(shù)據(jù)庫建設(shè)的學校提供參考,加快高校特色資源共建共享的進程。北京大學、清華大學、武漢大學、西安交通大學、廈門大學、東南大學等學校還表示愿意根據(jù)會議精神,在對各自的應(yīng)用系統(tǒng)進行修改后,盡快向兄弟院校免費提供。與此同時,大家還認同了將CALIS學位論文全文數(shù)據(jù)庫設(shè)計為“集中索引、分布式存儲”的數(shù)據(jù)庫的思路。
3.2教學參考書數(shù)據(jù)庫建設(shè)
CALIS管理中心充分意識到,建設(shè)教學參考書數(shù)據(jù)庫,對高校的公共基礎(chǔ)課、專業(yè)基礎(chǔ)課和一部分精選專業(yè)課的教學參考書提供上網(wǎng)服務(wù),可以滿足教育事業(yè)發(fā)展的需要,有效地解決各校教參復(fù)本量少的問題,在“十五”期間將“教學參考書數(shù)據(jù)庫”建設(shè)提到了議事日程上來。
根據(jù)《數(shù)字圖書館建設(shè)情況調(diào)查表》和《教學參考書數(shù)據(jù)庫情況調(diào)查表》反饋的結(jié)果,目前CALIS成員館教學參考書數(shù)據(jù)庫建設(shè)基本的情況是:14個學校已經(jīng)建有一定規(guī)模的教學參考書數(shù)據(jù)庫,另有11個學校開始籌劃;其中教參數(shù)據(jù)庫建庫時間最早的是中國人民大學圖書館,始于1996年;北京大學圖書館1999年開始建庫;包括復(fù)旦大學、清華大學圖書館在內(nèi)的8所高校圖書館從2000年開始建庫;其他的圖書館是在近一年里才開始和計劃進行教學參考書數(shù)據(jù)庫的建設(shè);這些學校的教學參考書書目數(shù)據(jù)量加在一起有49500條,全文數(shù)據(jù)有5100條,其中復(fù)旦大學的書目數(shù)據(jù)量最多,已達26,500條,中國人民大學的全文數(shù)據(jù)最多,有3000條;對于教學參考書數(shù)據(jù)庫系統(tǒng),有7所圖書館使用TRS全文數(shù)據(jù)庫進行二次開發(fā),有3所圖書館采用快葳公司的DIPS系統(tǒng),2所圖書館館使用方正Apabi系統(tǒng);選擇MARC做為教參元數(shù)據(jù)進行著錄的有5家,選擇DC做元數(shù)據(jù)的有3家;對于全文,一般采用WORD和PDF格式;對于版權(quán)問題,中國人民大學、西安交通大學、中國科技大學圖書館目前的解決辦法是限于校園網(wǎng)使用,其中中國人民大學圖書館已經(jīng)開始對教師著作征詢版權(quán),清華大學和上海交通大學圖書館目前的政策是部分解決版權(quán),同時結(jié)合訪問控制,北京大學圖書館、復(fù)旦大學圖書館正在考慮和專業(yè)公司合作,全面解決版權(quán);目前在主頁上有教學參考書項目鏈接的圖書館,有上海交通大學、復(fù)旦大學和廈門大學,其中復(fù)旦大學圖書館的檢索系統(tǒng)可以對外提供服務(wù),非校園網(wǎng)用戶可以瀏覽到書目級。
CALIS在6月中旬邀請22家中國高等學校數(shù)字圖書館聯(lián)盟理事單位召開了“教學參考書數(shù)據(jù)庫建設(shè)研討會”。會上,大家根據(jù)各自的工作經(jīng)驗對CALIS將在“十五”期間進行的教學參考書數(shù)據(jù)庫的建設(shè)工作提出了很好的建議:(1)標準規(guī)范方面:希望CALIS在標準、系統(tǒng)等方面提出方案與要求。(2)建設(shè)內(nèi)容:在學科上有所側(cè)重和分工。(3)版權(quán)問題:提出統(tǒng)一的版權(quán)解決方案。(4)管理方面:以211工程或CALIS名義,請學校教務(wù)部門將教參書的收集納入教務(wù)管理工作,以保證教參考書的權(quán)威性和新穎性。(5)建設(shè)方式:由CALIS組織購買一批有版權(quán)的電子參考書,同時在CALIS協(xié)調(diào)下,由部分高校分工建設(shè),共享數(shù)據(jù),成本分攤。(6)合作思路:和數(shù)據(jù)庫商與系統(tǒng)商合作開發(fā)系統(tǒng)和解決版權(quán)。(7)系統(tǒng)建設(shè):第一步參建各校分別建立教參信息庫,同時把數(shù)據(jù)集中起來建立CALIS教學參考信息庫;第二步建設(shè)電子全文數(shù)據(jù)庫。
針對以上建議,CALIS正在積極征集包括系統(tǒng)、資源、讀者使用、服務(wù)模式、實施、經(jīng)費預(yù)算等在內(nèi)的教學參考書數(shù)據(jù)庫的解決方案并通過申報、調(diào)研、審批方式確定承建單位。
4小結(jié)
CALIS管理中心通過“數(shù)字圖書館”、“學位論文數(shù)據(jù)庫”和“教學參考書數(shù)據(jù)庫”建設(shè)情況調(diào)查,從各個方面了解了成員館數(shù)字圖書館建設(shè)的情況,同時掌握了CALIS“十五”期間將建設(shè)的“學位論文數(shù)據(jù)庫”和“教學參考書數(shù)據(jù)庫”在成員館中的發(fā)展現(xiàn)狀。
為了傳承和弘揚大禹文化,受哲學社會科學研究院委托,單位成立了大禹文化研究中心,并召開了多次國內(nèi)學術(shù)會議。目前,在海峽兩岸研究人員的支持下,研究所已經(jīng)收集了大量有關(guān)大禹的書籍、考古資料。這些資料即包括已經(jīng)收集到的視頻、照片、古籍原件等多種實體內(nèi)容,也包括被“歷代石刻史料匯編”、“公元集成圖片庫”、“中國基本古籍庫”、“中國歷代典籍總目系統(tǒng)”、“中國數(shù)字方志庫”、“瀚堂典藏古籍數(shù)據(jù)庫”等專題數(shù)據(jù)庫所搜錄的文獻,還包括以大禹文化為主題新聞與資料。縱觀歷史,大禹文化在發(fā)展中進步,許多事實新聞,如“五水共治”等就是大禹文化建設(shè)的補充。因此,大禹文化資料庫的建設(shè)也是一個長期的與時俱進的過程。
2資料庫建設(shè)相關(guān)技術(shù)
2.1大數(shù)據(jù)技術(shù)
進入大數(shù)據(jù)時代,人們開始發(fā)現(xiàn)很多主題都開始變成了大數(shù)據(jù)。目前,大禹文化研究數(shù)據(jù)雖然不多,但由于大禹的歷史悠久,隨著考古技術(shù)的提升、大禹的歷史文化資料會變得越來越豐富,以大禹為主題的傳奇故事會以動漫、歷史劇等形式傳播出去。隨著水文化得到人們的重視,融合大禹元素的水文化傳播的信息也會大量增長。此外,大禹文化相關(guān)的電子商務(wù)以及無線傳感、虛擬空間技術(shù)在大禹主題旅游行業(yè)的應(yīng)用也會帶來大數(shù)據(jù)。因此,針對大禹主題的大數(shù)據(jù)研究也會成為一個重要研究方向,可以在這些大數(shù)據(jù)中獲得新的研究點。
2.2云計算
目前由于大禹文化研究資料分布在許多不同專題數(shù)據(jù)庫中,需要人工進行整合。這會耗費了大量的人力,造成的研究的瓶頸。為此,如果有必要通過商業(yè)和技術(shù)協(xié)議將其各庫中擁有的大禹文化資料共享出來,用云服務(wù)的方式為研究者提供統(tǒng)一的檢索平臺,以產(chǎn)生更大的社會效益。事實上,在教育領(lǐng)域,CALIS等圖書館共享平臺已經(jīng)在提供一個通用的文獻資料云,并取得了良好的效果。但大禹研究者需要更為專業(yè)的數(shù)據(jù)庫,如果能夠?qū)⒋笥碇黝}信息較為精確地從各大數(shù)據(jù)庫中抽取出來再作整理,必然能夠降低研究者檢索文獻的難度,增加其搜索內(nèi)容的廣度。因此,開展基于云服務(wù)的大禹專題數(shù)據(jù)庫構(gòu)建方法研究就顯得十分必要。
2.3垂直搜索引擎技術(shù)
由于收集資料的專業(yè)化和檢索方式的專門化,使得垂直搜索引擎具有通用搜索引擎不可替代的功能。事實上,除專題數(shù)據(jù)庫外,互聯(lián)網(wǎng)是獲取大禹專題信息的重要渠道。而建立專題數(shù)據(jù)庫類似于建立一個垂直搜索引擎。有了大禹主題的垂直搜索引擎,許多最新的研究資料也可以從互聯(lián)網(wǎng)中獲取。由此要做的工作就是設(shè)計大禹主題的網(wǎng)絡(luò)爬蟲,用爬蟲不斷抓取互聯(lián)網(wǎng)中的大禹文化研究資料,然后以搜索引擎的方式供研究者使用,并用統(tǒng)計方法對不斷增長的資料進行分析。事實上,許多專題數(shù)據(jù)庫(如國研網(wǎng))就是含有專題文獻摘要的搜索引擎。顯然,構(gòu)建大禹主題垂直搜索引擎會是專題數(shù)據(jù)庫建設(shè)主要內(nèi)容。
2.4多媒體信息檢索技術(shù)
大禹文化研究資料包括了大量視頻、照片等多媒體信息。但為這些多媒體信息建立標簽需要花費大量人力,需要引入自動標引技術(shù)。目前手寫體識別、截圖搜索、智能問答、視頻流中人臉識別等技術(shù)已得到廣泛的應(yīng)用。可以將這些多媒體技術(shù)用于對大禹文化資料的自動匹配和檢索,以增強研究者獲取資料的便捷性,進一步提升大禹文化專題數(shù)據(jù)庫的建設(shè)水平。
3資料庫設(shè)計思路
3.1設(shè)計目標
結(jié)合人工與計算機技術(shù),建立能夠?qū)Υ笥砦幕黝}相關(guān)信息的采集、加工和的平臺,為研究者提供較搜索引擎更為精確的研究資料,較其他專題數(shù)據(jù)庫更為完善的文獻數(shù)據(jù),較圖書館更為豐富的多媒體信息。
3.2信息采集功能設(shè)計
一般來講,專題數(shù)據(jù)庫的信息采集流程為:①確定專題信息的收集范圍,實現(xiàn)專題信息的手工采集、自動采集;②按照數(shù)字文獻格式標準體系對采集的專題信息進行存儲,生成數(shù)字化文獻;③以手工或自動的方式生成數(shù)字化文獻的元數(shù)據(jù)對元數(shù)據(jù)進行自動標引,采用一定的標準進行組織;④對不同的數(shù)據(jù)庫制作者賦予不同的權(quán)限,以手工或批量方式添加、修改、刪除元數(shù)據(jù),使元數(shù)據(jù)與數(shù)字對象建立對應(yīng),實現(xiàn)對元數(shù)據(jù)和數(shù)字對象的管理。按照數(shù)據(jù)的來源不同,需要設(shè)置不同采集形式,具體如下:已有資料電子化。即將已有的書籍和文獻資料人工轉(zhuǎn)換為掃描件,部分材料運用OCR技術(shù)轉(zhuǎn)換為文字格式,并將實物拍攝成照片,運用多媒體技術(shù)做好各類資料的文本標注。這樣就可以和已有的視頻等電子資料整合成多媒體資料集。用深度搜索引擎技術(shù),從各大數(shù)據(jù)庫中自動提取出大禹文化主題相關(guān)的文獻資料,直接引入其在原有數(shù)據(jù)庫中的文獻標識進行標注。設(shè)計好大禹文化主題網(wǎng)絡(luò)爬蟲,實時從互聯(lián)網(wǎng)中抓取主題相關(guān)資料,保存在搜索引擎專用的數(shù)據(jù)庫中。再應(yīng)用自動推薦技術(shù),向數(shù)據(jù)庫管理員推薦有價值的文獻資料,由管理員將互聯(lián)網(wǎng)中的文獻列入專題數(shù)據(jù)庫中供研究者檢索,即將文獻標引為不同的標志,如果文獻是從專題數(shù)據(jù)庫中獲取標明“引入”,搜索引擎直接獲取標明“互聯(lián)網(wǎng)”,數(shù)據(jù)庫管理員人工確認的則標明“人工入庫”。運用云技術(shù),將資料庫建在云端,與其他專題數(shù)據(jù)庫建立合作關(guān)系,獲得大禹專題文獻的推送服務(wù)。可以從專業(yè)文獻資料庫、垂直搜索引擎和多媒體信息檢索庫的角度來開展資料的收集和整理。
3.3信息檢索功能設(shè)計
為提升專題數(shù)據(jù)庫的功能,實現(xiàn)更好的用戶體驗,具體設(shè)計如下:實現(xiàn)一般文獻資料數(shù)據(jù)庫應(yīng)有的文本檢索功能。該數(shù)據(jù)庫提供主題、關(guān)鍵詞、摘要、標題、內(nèi)容等關(guān)鍵信息的全文檢索,并以pdf文件形式提供文獻資料。在大禹文獻數(shù)據(jù)庫中分析并整理出專業(yè)名詞集,形成大禹文化語義本體,為檢索者提供同義詞識別、主題相關(guān)檢索詞推薦等功能,并能夠按照訪問量、下載量、文獻引用量、發(fā)表時間等方式進行排序。對收集到的照片、視頻等多媒體資料作自動標注,建立多媒體檢索庫,實現(xiàn)文本到多媒體信息統(tǒng)一檢索接口。這里主要參考的標準是Mpeg-7,實現(xiàn)對視頻中幀、鏡頭、情節(jié)和節(jié)目的分離;同時用Sphinx來提取語音中的信息,實現(xiàn)語音向文本的自動轉(zhuǎn)換。這樣用戶就可以用關(guān)鍵詞、截圖、語音等方式來搜索資料庫中的多媒體資料。例如,用戶給出大禹陵的照片,就可以檢索到出現(xiàn)過該照片信息的視頻文件。提供智能問答系統(tǒng),讓研究者可以與虛擬資料庫管理員進行在線交流,由計算機自動提供文獻資料情況的解釋說明,從而提高專業(yè)數(shù)據(jù)庫服務(wù)的質(zhì)量。具體實現(xiàn)過程為:建立FAQ庫;對用戶的提問進行分析,將問題轉(zhuǎn)換成查詢關(guān)鍵詞;在FAQ庫中查到問題對應(yīng)的答案;對于在庫中查不到的問題,則給出提問要求,讓用戶進一步明確意圖;對多次查詢沒有結(jié)果的問題則從互聯(lián)網(wǎng)上獲取答案,并推薦給用戶;如果用戶認可推薦的答案,則將這個問題和答案組合加入到FAQ中去。事實上,清華大學圖書館的智能聊天機器人已經(jīng)實現(xiàn)了這樣的功能,并大大改善了查詢者的用戶體驗。運用大數(shù)據(jù)技術(shù),提供數(shù)據(jù)分析接口,讓研究者能夠從不斷增長的數(shù)據(jù)中快速分析出想要的統(tǒng)計信息。主要要實現(xiàn)流處理和批處理兩種處理方式。流處理主要針對不需要永久化存儲的過程信息,如相關(guān)旅游服務(wù)的實時信息和商品銷售信息。批處理則是針對長期積累在數(shù)據(jù)庫中的大數(shù)據(jù)進行分析。要通過檢索功能的優(yōu)化,實現(xiàn)具有大數(shù)據(jù)分析環(huán)境、面向新媒體的新型數(shù)據(jù)庫檢索平臺。
3.4信息檢索評估方法設(shè)計
在數(shù)據(jù)庫建設(shè)完成后,可以用信息檢索的傳統(tǒng)方法對構(gòu)建好的數(shù)據(jù)庫要進行測試與評估,方法如下:
3.4.1雙率檢測
雙率檢測,即對數(shù)據(jù)庫檢索的查全率和查準率進行評估。先要設(shè)計一套測試用關(guān)鍵詞和測試用資料,然后對關(guān)鍵詞查詢的結(jié)果進行統(tǒng)計,獲取查詢結(jié)果與測評用資料的實際匹配程度。同時統(tǒng)計出被查得文獻資料個數(shù)與實際已經(jīng)存儲資料個數(shù)的比值。在查詢時要考慮查詢對象除文本資料外,還有多媒體資料,要設(shè)計多種樣本進行評估。
3.4.2對大數(shù)據(jù)統(tǒng)計分析結(jié)果進行評估
對大數(shù)據(jù)統(tǒng)計分析結(jié)果進行評估。即用人工評價的方式來對統(tǒng)計結(jié)果的正確性以及推薦結(jié)果的合理性進行打分,從而為優(yōu)化統(tǒng)計分析算法打下基礎(chǔ)。
3.4.3響應(yīng)時間測評
設(shè)計不同的關(guān)鍵詞組合,記錄查詢的時間,評估出系統(tǒng)的響應(yīng)速度,設(shè)定響應(yīng)閾值,并分析響應(yīng)緩慢的原因。
3.4.4語義本體合理性評估
設(shè)計專業(yè)術(shù)語中容易混淆的一組關(guān)鍵詞進行檢索,統(tǒng)計出同義詞和專用詞轉(zhuǎn)換的成功率,以利于優(yōu)化大禹主題本體的設(shè)計。信息檢索評估的體系十分復(fù)雜,要抓住專題數(shù)據(jù)庫針對強的特點來測試,測試的主要目的是提高用戶體驗。
4結(jié)束語
(一)學生英語水平參差不齊
《數(shù)據(jù)庫應(yīng)用》課程針對的是大二學生,這些學生在大一時已經(jīng)完成了大學英語的學習,基本具備了四千左右的詞匯量和一定的英語閱讀方面的能力。但仍然有較大一部分學生很難或根本不會用英語與他人進行交流,停留在“聾子英語”、“啞巴英語”上,使得學習的信心不足,這就有可能使工科學生出現(xiàn)極大的恐懼情緒和厭學情緒,不管是英語水平還是專業(yè)理解能力都不是在一個水平線上,更進一步導致學生的水平參差不齊。
(二)專業(yè)英語與專業(yè)課內(nèi)容相結(jié)合的適應(yīng)時間較長
對于計算機專業(yè)的學生來講,《數(shù)據(jù)庫應(yīng)用》課程的雙語教學過程,不僅需要學生掌握數(shù)據(jù)庫方面的專業(yè)詞匯,而且還需要學生將專業(yè)術(shù)語與專業(yè)課的學習結(jié)合起來,這將需要有一定的適應(yīng)時間,而且這個時間還可能很長。而在教學過程中,學生是主體,如果在這個過程中適應(yīng)時間太長,使得學生并沒有從雙語教學中獲益,這將影響雙語教學的初衷,達不到應(yīng)有的教學效果。
(三)師資方面的問題
雙語教學,要求授課教師不僅要有扎實的專業(yè)知識,同時也要有良好的英語表達能力。對民辦院校而言,在計算機專業(yè)中,雙語方面優(yōu)秀師資比較欠缺。一是,由于我院所處的地理位置離市區(qū)相對較遠,這就導致很多非常優(yōu)秀的教師不太愿意來我院授課;二是,由于限于資金等種種因素,我系教師被送到國外進行學習和進修的機會非常少。對于我院現(xiàn)有的校內(nèi)老師而言,外語專業(yè)的教師對計算機的專業(yè)課程缺乏了解,而計算機專業(yè)教師又普遍不具備良好的外語口語表達能力。雖然在我院從事雙語教學的教師都具有碩士及碩士以上學位,同時在計算機專業(yè)課程授課的功底非常扎實,而且在英語科技文章的閱讀能力也相對較強,但大部分的教師都沒有國外的學習或進修的經(jīng)歷,在口語等方面比較薄弱。若完全采用英語課件和英語授課,在教學過程中有很大的困難。
二、《數(shù)據(jù)庫應(yīng)用》課程雙語教學改革的具體實施
(一)教學目標
雙語教學首先要有正確的教學目標,在《數(shù)據(jù)庫應(yīng)用》課程中,英語授課僅僅是一種手段,其最終目的是培養(yǎng)學生通過所學的數(shù)據(jù)庫專業(yè)知識并且運用其中的技術(shù)去實際解決問題,從而激發(fā)學生在計算機領(lǐng)域中繼續(xù)學習和研究的愿望。首先應(yīng)把《數(shù)據(jù)庫應(yīng)用》課程中的專業(yè)知識的學習放在首位,然后把雙語教學中的英語教學作為一種滲透。在該課程的雙語教學過程中應(yīng)該積極使用英語授課,要求學生能夠讀懂、理解課程的內(nèi)容和表達方式即可。因此,教師應(yīng)明確該課程的核心教學的目的,歸納如下:通過對《數(shù)據(jù)庫應(yīng)用》雙語課程的講授,學生應(yīng)該理解和掌握數(shù)據(jù)庫系統(tǒng)的基本原理及相關(guān)應(yīng)用技術(shù)。學生通過在該課程中學習的數(shù)據(jù)庫的專業(yè)知識,將它們運用到實際中去,解決有關(guān)數(shù)據(jù)庫的實際問題,能夠應(yīng)對數(shù)據(jù)庫應(yīng)用系統(tǒng)設(shè)計、應(yīng)用和維護的任務(wù)。從而,學生逐步形成獨立發(fā)現(xiàn)問題、思考問題、分析和實際解決問題的能力,同時提高學生的自學能力和創(chuàng)新能力等。
(二)教學模式
目前,國外的雙語教學有多種模式。沉浸式(im-mersionprogram)、保持式(maintenancebilingualedu-cation)、過渡式(transitionalbilingualeducation)等。在民辦高校中開展《數(shù)據(jù)庫應(yīng)用》課程的雙語教學,首先要根據(jù)該課程的實際要求、學生在雙語教學過程中的接受能力和英語的詞匯和閱讀水平等具體情況,來決定在我院的《數(shù)據(jù)庫應(yīng)用》雙語課程中的具體模式。然后再根據(jù)課程的教學進度和進展情況以及學生對課程的適應(yīng)情況,可以對該課程進行及時調(diào)整,最終達到掌握數(shù)據(jù)庫的專業(yè)知識和提高學生實際英語能力的雙重目標。同時考慮《數(shù)據(jù)庫應(yīng)用》課程的特點和《數(shù)據(jù)庫應(yīng)用》雙語教學仍處在初期,因此,《數(shù)據(jù)庫應(yīng)用》課程的雙語教學模式采用中文講授+英文課件,即在授課過程中,使用英文教材,教師在講授專業(yè)知識時以中文為主,同時介入英語表達,循序漸進,逐步提高學生在《數(shù)據(jù)庫應(yīng)用》課程中的理論知識和運用水平的基礎(chǔ)上,保證學生英語專業(yè)詞匯和閱讀能力水平的提高。
(三)課堂教學的組織實施和教學方法
1.采用案例引導、任務(wù)驅(qū)動式的教學模式。
在授課過程中,教師應(yīng)該根據(jù)課程的內(nèi)容,為學生安排學習任務(wù),使學生在完成所布置任務(wù)的同時掌握相關(guān)數(shù)據(jù)庫的知識。在案例引導、任務(wù)驅(qū)動式模式下,教師必須要縱觀整個《數(shù)據(jù)庫應(yīng)用》課程,充分發(fā)掘英語教材,精心設(shè)計問題,為學生提供自主學習的良好機會。在設(shè)計任務(wù)時,問題可以使用課本后面的練習題,也可根據(jù)課本內(nèi)容自編相關(guān)的題目。然后根據(jù)教學大綱和本課程的教學重點和難點,同時還要考慮學生在完成過程中可能遇到的困難去擬定相關(guān)的題目。通過自主的發(fā)現(xiàn)和探索、自主的質(zhì)疑、和同學進行討論等多種方式,學生不僅體驗到成功解決問題的快樂,而且激發(fā)了學習《數(shù)據(jù)庫應(yīng)用》雙語課程的興趣,因此,增強了學習的信心和勇氣。
2.組織討論和演講。
在上課時,授課教師應(yīng)該鼓勵學生當“老師”,給學生創(chuàng)造使用英語交流和實踐的機會。針對在上課中遇到的問題,教師應(yīng)多鼓勵學生學會獨立思考問題、大膽質(zhì)疑并且敢于發(fā)表自己不同的觀點。另外,在課堂上還可以挑選出幾個有代表性的學生進行演講。最后,教師對學生的表現(xiàn)和學生對問題的分析進行總結(jié)。這就使得在雙語教學過程中,學生所獲得的是在豐富的情境中,不斷發(fā)展著的英語表達能力和專業(yè)知識的運用能力。同時在雙語教學中進行討論,能夠讓學生提高該課程的主動性和積極性,從而為培養(yǎng)學生運用英語的能力打下堅實的基礎(chǔ)。
3.上機實驗和課程設(shè)計過程。
《數(shù)據(jù)庫應(yīng)用》課程應(yīng)該注重理論和實踐相結(jié)合。每周的理論課之后,都安排相應(yīng)的實驗課。學生可以通過上機練習達到真正理解課堂上的知識。此外,在課程快結(jié)束的時候,為每組學生分配一個實際的數(shù)據(jù)庫應(yīng)用系統(tǒng)的開發(fā)項目。這樣可以使學生去思考和實踐數(shù)據(jù)庫開發(fā)設(shè)計中具體的思路和方法,最終完成課程設(shè)計的任務(wù)。課程設(shè)計的開展,促使學生將所學的知識運用到實際的開發(fā)過程中去,并且使學生將所學到的知識融會貫通并且鞏固和提高。最后,學生需上交具體實現(xiàn)的系統(tǒng)和一份英文的課程設(shè)計報告,這將培養(yǎng)學生撰寫英文文檔和論文的能力。
(四)雙語考核形式
《數(shù)據(jù)庫應(yīng)用》雙語課程的期末綜合測評成績采用過程考試和期末考試兩種方法。過程考試即平時成績,包括考勤、作業(yè)、實驗、學生參與的課堂內(nèi)容的情況。教師制定一個具體的評價指標,對平時成績參照評價指標進行詳細的記錄。期末考試采用閉卷方式,主要考查學生對教材上基本知識點的掌握程度。過程考試和期末考試成績按一定的比例計算。采用過程考試和期末考試相結(jié)合的方法是評價《數(shù)據(jù)庫應(yīng)用》教學效果的一個重要手段,而且這兩項合理的結(jié)合能促進學生英語能力的提高和數(shù)據(jù)庫專業(yè)知識的學習。
三、總結(jié)
1.系統(tǒng)管理子模塊系統(tǒng)管理子模塊主要實現(xiàn)對操作員信息的初始錄入、權(quán)限的管理、密碼的修改和系統(tǒng)初始化的設(shè)置等。這些操作都對應(yīng)著數(shù)據(jù)庫的單表操作,該模塊設(shè)計容易實現(xiàn)。由于初始化數(shù)據(jù)的錄入量一般較大,因此,我們對于信息的初始錄入工作,支持全鍵盤批量數(shù)據(jù)錄入,把一種信息的錄入集成在一個窗體模塊中,盡量減少用戶的工作量,便于用戶的使用。
2.信息資料子模塊信息資料子模塊主要實現(xiàn)了專業(yè)信息、課程信息、學生基本信息和成績的增加、修改和刪除操作。此功能模塊的設(shè)計,都是便于信息查詢模塊的實現(xiàn),重要的是所有的專業(yè)、課程、學生及成績信息都必須是真實可靠的,否則將會影響到信息查詢模塊功能的實現(xiàn),同時,填加學生基本信息時,要考慮到整個系統(tǒng)各個模塊之間的聯(lián)系,因為所有其他信息功能的實現(xiàn)都與學生基本信息有著關(guān)聯(lián)。
3.信息查詢子模塊(1)課程查詢:根據(jù)查詢內(nèi)容(按專業(yè)、按所屬院系、按課程名稱)來查詢學生的課程信息。(2)學生資料查詢:根據(jù)查詢內(nèi)容(按學號、按姓名、按專業(yè)、按班級)來查詢學生的基本信息。(3)成績查詢:根據(jù)查詢內(nèi)容(按學號、按姓名、按專業(yè)、按課程)來查詢學生的成績信息。
二、數(shù)據(jù)庫設(shè)計與實現(xiàn)
1.數(shù)據(jù)庫的設(shè)計該系統(tǒng)可利用ER方法進行數(shù)據(jù)庫的概念設(shè)計,首先設(shè)計局部ER模式,其次把各局部ER模式綜合成一個全局模式,得到最終的模式,即概念模式。(1)設(shè)計局部ER模式實體和屬性的定義:學生(學號,姓名,性別,出生年月,身份證號,入學成績,所學專業(yè),所在班級,備注,聯(lián)系人,電話);專業(yè)(專業(yè)名,所屬院系,招生類型,修學年限,所屬學分);課程(課程編號,課程名,學時,所屬專業(yè),學分,所屬院系,授課學期,教材名);成績(學號,姓名,所學專業(yè),班級,所學課程,課程性質(zhì),學分,成績,備注);用戶名(用戶名,密碼,所在部門)。ER模型的“聯(lián)系”用于刻畫實體與實體之間的關(guān)聯(lián),如1∶N,M∶N,還是1∶1等形式。在該系統(tǒng)中學生與課程、學生與專業(yè)實體之間是M∶N的關(guān)聯(lián),而學生與成績兩個實體之間關(guān)聯(lián)則為1∶1。(2)全局ER模式的設(shè)計在確定好所有的局部ER模式后,就將它們綜合成整體的全局概念結(jié)構(gòu)。設(shè)計全局ER模式的目的不在于把若干局部ER模式形式上合并為一個ER模式,而在于消除沖突,使之成為能夠被所有用戶共同理解和接受的概念模型。全局ER模式不僅要支持所有局部ER模式,而且必須合理地表示一個完整、一致的數(shù)據(jù)庫概念結(jié)構(gòu)。根據(jù)上述功能在后臺SQL2000數(shù)據(jù)庫中部分數(shù)據(jù)表的設(shè)計如下。
農(nóng)村集體土地確權(quán)數(shù)據(jù)庫入庫前的準備工作直接關(guān)系到外業(yè)調(diào)繪數(shù)據(jù)能否被有效、完整地錄入。準備工作主要是對地籍編號、空間數(shù)據(jù)、非空間數(shù)據(jù)及掃描文檔的編輯。建庫的數(shù)據(jù)主要分空間數(shù)據(jù)、非空間數(shù)據(jù)和掃描文檔三類,空間數(shù)據(jù)包括矢量數(shù)據(jù)和柵格數(shù)據(jù)。
1.1地籍編號
宗地代碼的編碼是按照最新的規(guī)則,采用五層19位層次碼結(jié)構(gòu),分別是:第一層次為縣級行政區(qū)劃,代碼為6位。第二層次為地籍區(qū),代碼為3位,用阿拉伯數(shù)字表示。第三層次為地籍子區(qū),代碼為3位,用阿拉伯數(shù)字表示。第四層次為土地權(quán)屬類型,代碼為2位,其中,第一位表示土地所有權(quán)類型,用G、J、Z表示;第二位表示宗地特征碼,用A、B、S、X、C、W、Y表示。第五層次為宗地順序號,代碼為5位,用00001~99999表示,在相應(yīng)的宗地特征碼后編碼[2]。由于完整的地籍號有19位數(shù)字,若對每類需要入庫的要素逐一設(shè)定完整的地籍號,初期工作會很繁瑣,不利于提高工作效率。在實際工作中為了提高效率,先將前14位編號一樣的地區(qū)的宗地用五位及以下宗地號命名,外業(yè)調(diào)查成果均使用此方法命名地籍號。而在后期整理入庫過程中必須將此類簡易宗地號規(guī)范化,為此需要根據(jù)各類數(shù)據(jù)類型采用編寫程序重命名、Excel批量處理等方式規(guī)范地籍號,為數(shù)據(jù)入庫打好基礎(chǔ)。
1.2空間數(shù)據(jù)
此部分主要是對CASS中的圖形作進一步處理,以達到入庫的需要,包括對dwg格式的數(shù)據(jù)進行檢查整理,并對其格式進行轉(zhuǎn)換。CASS數(shù)據(jù)編輯是數(shù)據(jù)建庫的第一步。本文所討論的基礎(chǔ)數(shù)據(jù)是通過CASS軟件處理后的dwg格式數(shù)據(jù),進行數(shù)據(jù)轉(zhuǎn)換前需要對dwg數(shù)據(jù)進行整理,內(nèi)容如下:(1)房屋被界址線切割的修改。對于分戶未分房,造成權(quán)屬線把房屋切割開來,這樣在入庫時就會出現(xiàn)該房屋的戶主不唯一的情況,為此要把此類房屋分割開來(房屋繪制順序要為順時針)。(2)清除廢塊,減少數(shù)據(jù)量。用“文件”——“清理圖層”或“PURGE”命令對圖層進行清理,不僅可以清除多余圖塊,加快處理速度,而且能通過編碼正確性檢查。(3)刪除重復(fù)要素。用“檢查入庫”——“刪除重復(fù)實體”來解決,保證同一個位置上只有一個實體[3]。(4)圖形實體檢查。利用“檢查入庫”——“圖形實體檢查”的方法進行檢查,包括編碼正確性檢查、圖層正確性檢查、線自交檢查、建筑物注記檢查、復(fù)合線重復(fù)點檢查(此處檢查要確保JZD層是關(guān)閉的)。(5)檢查未閉合的房屋線和權(quán)屬線[3]。CASS中未閉合的多邊形將無法導出成面,因此對于未閉合的房屋線和權(quán)屬線要將其閉合。(6)過濾無屬性實體。在CASS中很容易把實體的屬性漏掉,這樣會給后續(xù)的工作帶來很多麻煩,因此要通過“檢查入庫”——“過濾無屬性實體”的方法進行檢查,然后再根據(jù)實際情況把無屬性的實體賦以屬性。本文主要針對CASS成圖數(shù)據(jù)進行闡述,將其導入MapGIS6.7之前需進行對照表和文件轉(zhuǎn)換[1]。(1)對照表。對系統(tǒng)庫目錄\slib下4個對照表文件進行編輯,可直接用Windows寫字板或記事本方式打開。需要注意的是,對照表中CASS編碼是在“數(shù)字測圖”系統(tǒng)中查到的,并且要區(qū)分對照表的大小寫[1]。符號對照表——“arc—map.pnt”。線型對照表——“arc—map.lin”。顏色對照表——“cad—map.clr”。層對照表——“cad—map.tab”。(2)文件轉(zhuǎn)換。CASS成圖數(shù)據(jù)即dwg格式的數(shù)據(jù)無法在MapGIS中打開,需要將dwg格式轉(zhuǎn)換為AutoCAD的數(shù)據(jù)交換格式DXF[4],最好是2000或者R12的DXF格式。把各個圖層通過“文件——圖形改名存盤”命令保存成AutoCAD2000/LT2000DXF格式,選擇“文件轉(zhuǎn)換”模塊,“輸入——裝入DXF”,將AutoCAD文件裝入[5],并將所有DXF轉(zhuǎn)換為點線文件,最后存點存線即可。在MapGIS6.7平臺中,點擊“圖形處理”——“輸入編輯”,添加文件即可對其進行屬性編輯。
1.3非空間數(shù)據(jù)
非空間數(shù)據(jù)包括空間對象的補充屬性數(shù)據(jù),是以mdb表的形式存在的。對于其他的各種證件照片、大門照片、調(diào)查表、審批表等都是要按照標準形式命名的,命名格式為a1#a2$1.jpg,其中a1為土地證號,a2為地籍號,中間要用#和$隔開。2.4掃描文檔這一部分主要是各種掃描的文件,如村民小組村民代表會決議、集體土地使用權(quán)確權(quán)登記頒證申請書、農(nóng)村土地權(quán)屬調(diào)查法人身份證明書、農(nóng)村土地權(quán)屬調(diào)查指界人身份證明書等,命名格式同上。
2建庫基本流程
為規(guī)范農(nóng)村集體土地確權(quán)數(shù)據(jù)庫的內(nèi)容、數(shù)據(jù)庫結(jié)構(gòu)、數(shù)據(jù)交換格式,該部分應(yīng)嚴格按照要求,統(tǒng)一在MapGIS四川農(nóng)村集體土地確權(quán)登記發(fā)證系統(tǒng)下完成。
2.1新建數(shù)據(jù)庫
主庫MPDBASTER主要是建立SQL2005與GDB之間的連接,打開MAPGISK9平臺,通過“工具箱——GDB安裝器”創(chuàng)建。當打開SQLSERVER,點擊數(shù)據(jù)看到里面有個MPDBASTER,說明SQL和GDB連接成功。主庫建好后,現(xiàn)在還需添加數(shù)據(jù)庫,根據(jù)需要可以添加多個庫。同樣用創(chuàng)建主庫的方法來創(chuàng)建數(shù)據(jù)庫。
2.2配置MapGIS數(shù)據(jù)源
打開GDB企業(yè)管理器,設(shè)置連接數(shù)據(jù)庫的數(shù)據(jù)源即可。
2.3初始化數(shù)據(jù)庫
MapGIS四川農(nóng)村集體土地確權(quán)登記發(fā)證系統(tǒng)的配置主要是通過“開始”“程序”“MapGIS四川農(nóng)村集體土地確權(quán)登記發(fā)證系統(tǒng)”“管理員配置工具”來實現(xiàn)的。如果測試成功,就會在數(shù)據(jù)庫中創(chuàng)建多張表,以用于上傳屬性數(shù)據(jù)、圖形數(shù)據(jù)和掃描材料,否則要重新配置。由于某些原因,系統(tǒng)還是會缺少上傳掃描材料的兩張表UPFILESLIST和CASEMATERIALLIST,就需要借助語句手動創(chuàng)建。初始化完成以后,把JHTB(接合圖表)、CODE(數(shù)據(jù)字典)、DLTB(地類圖斑)、FW(房屋)、FWZJ(房屋注記)、QSDW(權(quán)屬地物)、QSDWZJ(權(quán)屬地物注記)、DDXYS(點地形要素)、XDXYS(線地形要素)、ZJD(宅基地)、ZJDZJ(宅基地注記)、JZD(界址點)、GCDZJ(高程點注記)、GCZJD(高程注記點)等文件導入并去后綴即可。
2.4新建工程
打開MapGIS四川農(nóng)村集體土地確權(quán)登記發(fā)證系統(tǒng),如果數(shù)據(jù)是通過xyz工程管理的點線區(qū)數(shù)據(jù),工程升級即可;如果是零散的點線區(qū)文件,則通過“新建工程”導入。由于在MapGIS6.7中編輯的點線區(qū)文件只有少許基本的屬性字段,需要對照標準庫通過“建庫工具箱——數(shù)據(jù)結(jié)構(gòu)升級”,使其具備該圖層應(yīng)有的屬性字段,在系統(tǒng)彈出數(shù)據(jù)結(jié)構(gòu)升級詳細設(shè)置對話框,點擊升級按鈕即可。升級完成后,如果還需添加字段,可通過點擊圖層右鍵進行添加。
2.5導入mdb表,掛接屬性
在圖形的拓撲檢查完成的前提下,為了補充圖層缺少的屬性數(shù)據(jù),其最有效快速的方法是把空間對象的補充屬性數(shù)據(jù)mdb表導入到庫里。對業(yè)務(wù)建庫的數(shù)據(jù)庫文件mdb字段分析即可得出各項屬性數(shù)據(jù)所對應(yīng)的字段,再利用Access的導出功能將數(shù)據(jù)庫中各表分別導出,然后提取Excel屬性匯總表中對應(yīng)列的數(shù)據(jù)填充。全部填充完畢之后再使用Access軟件的導入功能將數(shù)據(jù)導回業(yè)務(wù)建庫數(shù)據(jù)庫,然后再通過SQL語句掛接屬性。通過AccessDataConvert文件夾中的工具AccessDataConvert.exe導入mdb表,選擇Initialstddb.mdb表,點擊“導入數(shù)據(jù)——下一步——轉(zhuǎn)入業(yè)務(wù)表”即可。此時出現(xiàn)如圖4中所示的消息時,點開消息,查看具體是哪里出現(xiàn)了問題,根據(jù)指出的問題所在,逐個修改之后重新導入。如此循環(huán),直至成功導入。需要補充的是在掛接屬性時若以宗地號為鏈接對象,在MapGIS6.7中編輯時必須要有宗地號這一字段。掛接完以后,可通過“農(nóng)村集體土地確權(quán)登記發(fā)證系統(tǒng)——查詢分析”功能查詢宗地屬性信息。對于有些屬性,可通過集體土地使用權(quán)調(diào)查數(shù)據(jù)庫建庫系統(tǒng)里工具箱下的圖層內(nèi)屬性賦值和圖層間屬性賦值來完成。
2.6上傳檔案掃描件
為了方便工作人員查詢、管理,實現(xiàn)高效的無紙化辦公,需將檔案掃描入庫并與宗地圖相掛接,因此檔案掃描件的規(guī)模化管理也是調(diào)查的一項重要工作。掃描文件的類型一般有申請書、戶口簿、宗地圖、外業(yè)公示照片、大門照片、法人身份證明書等,如果還有其他文件,放到其他里。為了提高工作效率,可以先簡易命名掃描檔案文件并按宗地號存放,再利用后期自動化處理的方法,可以快速地將掃描檔案歸檔并方便后期快速整理。整理好掃描文件后通過ImgUpLoadTool中的ImgUpLoadTool.exe來上傳到庫里。將檔案掃描件按文件類型分門別類存放在不同的文件夾里,并根據(jù)行政歸屬劃分多級目錄存儲。如圖5中所示,選擇形式6編輯完成以上工作,即可通過如圖6中所示打印相關(guān)證書。
3建庫時應(yīng)注意的問題
(1)把CASS圖轉(zhuǎn)到MapGIS中時的注意事項包括:確保每一戶的宗地號、戶主等信息都在對應(yīng)的權(quán)屬線內(nèi);房屋注記要正確,包括房屋結(jié)構(gòu)和房屋層數(shù)注記。(2)格式轉(zhuǎn)化完成后,在MapGIS中打開,進行“檢查——工作區(qū)屬性檢查”主要查看的內(nèi)容有:對已造面的如房屋、宗地、土地類型等,查看面積是否有空的,再者就是不合理面域,要將其刪除;對于宗地層,要查看宗地號、戶主等是否有空的;對于房屋層,要看房屋結(jié)構(gòu)和房屋層數(shù)是否正確,是否有遺漏,房屋層數(shù)和房屋結(jié)構(gòu)是否要分開等。對以上檢查出的有問題的要逐一修改,直至無誤。(3)在進行結(jié)構(gòu)升級時,為了把之前已加載的屬性保留,要把多余字段追加、維護默認屬性以及維護面積周長前打鉤。(4)掛接屬性要在圖形關(guān)系正確的前提下完成,掛接完以后若要再改會很麻煩。
4結(jié)束語
關(guān)鍵詞:數(shù)據(jù)挖掘電子商務(wù)關(guān)聯(lián)規(guī)則
1引言
目前,在需要處理大數(shù)據(jù)量的科研領(lǐng)域中,數(shù)據(jù)挖掘受到越來越多的關(guān)注。我們可以利用數(shù)據(jù)挖掘技術(shù)從海量數(shù)據(jù)中發(fā)現(xiàn)有用信息,幫助商家了解客戶以往的需求趨勢,并預(yù)測未來,從而給商家?guī)砭薮蟮睦麧櫋T跀?shù)據(jù)挖掘領(lǐng)域,采用關(guān)聯(lián)規(guī)則在大型事務(wù)數(shù)據(jù)庫中進行數(shù)據(jù)挖掘是一個重要的研究內(nèi)容。關(guān)聯(lián)規(guī)則是美國IBMAlmadenResearchCenter的RabeshAgrawal等人于1993年首先提出的KDD研究中的一個重要課題。關(guān)聯(lián)規(guī)則挖掘的一般對象是事務(wù)數(shù)據(jù)庫,這種數(shù)據(jù)庫的主要應(yīng)用在零售業(yè),比如超級市場的銷售管理。關(guān)聯(lián)規(guī)則就是發(fā)現(xiàn)事務(wù)數(shù)據(jù)庫中不同商品(項)(Item,指事務(wù)中的內(nèi)容,比如,面包、牛奶等都是項目)之間是否存在某種關(guān)聯(lián)關(guān)系。通過這些規(guī)則找出顧客購買行為模式,如購買了某一商品對購買其他商品的影響。發(fā)現(xiàn)這樣的規(guī)則可以應(yīng)用于商品貨架設(shè)計、貨存安排以及根據(jù)購買模式對用戶進行分類。
2關(guān)聯(lián)規(guī)則描述
目前關(guān)聯(lián)規(guī)則挖掘主要考慮支持度和置信度兩個閾值。設(shè)X是項集,T是數(shù)據(jù)庫DB中的任意一個記錄。X的支持度是指支持X的記錄數(shù)與全體記錄數(shù)的比,Support(X)=|{T|TX,T∈DB}|/|DB|。蘊涵關(guān)系X==>Y在數(shù)據(jù)庫DB中的置信度是指同時支持X和Y的記錄數(shù)與支持X的記錄數(shù)之比,即:Confidence(X==>Y)=|{T|TXY,T∈DB}|/|{T|TX,T∈DB}|支持度可理解為在DB中隨機抽取一個記錄,該記錄同時支持X和Y的概率。置信度可理解為在支持X的記錄全體中隨機取一個記錄,該記錄支持Y的概率。
3發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的操作步驟
目前,由于條碼技術(shù)的發(fā)展,顧客在超市中購買商品的信息可以很方便的被存放在數(shù)據(jù)庫中,針對數(shù)據(jù)庫中大量的數(shù)據(jù),我們?nèi)绾伟l(fā)現(xiàn)它們之間存在的關(guān)聯(lián)是本文主要討論的問題。關(guān)聯(lián)規(guī)則的挖掘問題就是在超市事務(wù)數(shù)據(jù)庫DB中找出具有用戶給定的最小支持度和最小置信度的關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則的挖掘?qū)κ袌稣{(diào)節(jié)和爭取顧客方面的應(yīng)用是極有價值的。因此,有必要采用快速算法從超市事務(wù)數(shù)據(jù)庫中挖掘關(guān)聯(lián)規(guī)則。由超市事務(wù)數(shù)據(jù)庫發(fā)現(xiàn)關(guān)聯(lián)規(guī)則挖掘可以分以下兩步完成:
1)找出超市事務(wù)數(shù)據(jù)庫DB中所有大于等于用戶指定最小支持度的項目集,具有最小支持度的項目集稱為頻繁項集。
2)利用頻繁項集生成所期望的關(guān)聯(lián)規(guī)則,即這些規(guī)則必須滿足最小支持度min_supp和最小置信度min_conf。
事實上,第一步的任務(wù)是迅速高效地找出超市事務(wù)數(shù)據(jù)庫DB中全部頻繁項集,數(shù)據(jù)挖掘所面臨的最大的挑戰(zhàn)是計算效率問題,解決這一問題的途徑是產(chǎn)生高效的數(shù)據(jù)挖掘算法,但從超市事務(wù)數(shù)據(jù)庫中產(chǎn)生頻繁項集即費時又占用空間,所以說第一步是關(guān)聯(lián)規(guī)則挖掘的核心問題,是衡量關(guān)聯(lián)規(guī)則挖掘算法的標準。當找到所有的頻繁項集后,相應(yīng)的關(guān)聯(lián)規(guī)則將很容易生成,目前大多數(shù)的關(guān)聯(lián)規(guī)則挖掘算法研究是針對第一步而提出的,本文重點討論第一個問題。
4由超市事務(wù)數(shù)據(jù)庫發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的總體設(shè)計
在現(xiàn)有的不少關(guān)聯(lián)規(guī)則發(fā)現(xiàn)算法中,最著名的仍然是R.Agrawal本人在他們自己的AIS算法基礎(chǔ)上于1994年提出的Apriori算法,Apriori算法的基本思想是:利用“頻繁項集的所有非空子集都必須也是頻繁的”這一定理對事務(wù)數(shù)據(jù)庫進行多遍掃描。
眾所周知,對數(shù)據(jù)庫的掃描伴隨繁重的磁盤I/O任務(wù),Apriori算法中,掃描次數(shù)較多,這樣就大大限制了挖掘算法的速度。因此,在實際的應(yīng)用中,減少對事務(wù)數(shù)據(jù)庫的掃描次數(shù),有效地減少數(shù)據(jù)的吞吐,將會有效提高算法的效率。為了高效率的由超市事務(wù)數(shù)據(jù)庫中發(fā)現(xiàn)關(guān)聯(lián)規(guī)則,本系統(tǒng)在Apriori算法的基礎(chǔ)上采用基于劃分的算法。該算法只對事務(wù)數(shù)據(jù)庫DB掃描兩次,大大減少了I/O操作,從而提高了算法的效率。
通過劃分方法進行數(shù)據(jù)挖掘的過程如下圖所示:
本系統(tǒng)的總體設(shè)計包含三部分:
(1)在服務(wù)器端第一次掃描超市事務(wù)數(shù)據(jù)庫中的表,按照超市事務(wù)數(shù)據(jù)庫中不同項集的數(shù)量,以及兼顧客戶端計算機硬件配置,對其進行數(shù)據(jù)分塊,分塊的大小選擇要使得每個分塊可以被放入主存。
(2)在各個客戶端計算機上,利用并行技術(shù)分別訪問服務(wù)器上的數(shù)據(jù)分塊,求出各數(shù)據(jù)分塊所對應(yīng)的局部頻繁項集,并將所求局部頻繁項集存入服務(wù)器的一個指定表中。
(3)在服務(wù)器端,匯總各個分塊數(shù)據(jù)生成的局部頻繁項集,第二次掃描超市事務(wù)數(shù)據(jù)庫中的總表,最終生成全局頻繁項集。
系統(tǒng)的總體設(shè)計可以如下圖2應(yīng)用程序總體設(shè)計所示。
一旦由超市事務(wù)數(shù)據(jù)庫DB中的事務(wù)找出頻繁項集,由它們產(chǎn)生強關(guān)聯(lián)規(guī)則是直截了當?shù)摹K^的強關(guān)聯(lián)規(guī)則是指滿足最小支持度和最小置信度的規(guī)則。
目前在WINDOWS環(huán)境下有多種訪問WEB數(shù)據(jù)庫的技術(shù),主要有:
1.公共網(wǎng)關(guān)接口CGI(CommonGatewayInterface)
CGI是較早實現(xiàn)的技術(shù)。適用于多種服務(wù)器平臺,如UNIX、WINDOWS等,但CGI的開發(fā)成本高、維護困難、功能有限、不具備事務(wù)處理功能、占用服務(wù)器資源較多。
2.INTERNET數(shù)據(jù)庫連接器IDC(InternetDatabaseConnector)
IDC集成在ISAPI(InternetServerAPI)中,充分利用了DLL技術(shù),易擴充,但編程較CGI更為復(fù)雜,只適用于小型數(shù)據(jù)庫系統(tǒng)。
3.先進數(shù)據(jù)庫連接器ADC(AdvanceDatabaseConnector)
ADC提供了ActiveXControl來訪問數(shù)據(jù)庫,它的主要特點是數(shù)據(jù)查詢由用戶端瀏覽器執(zhí)行,因而需將服務(wù)器端數(shù)據(jù)庫中的部分記錄下載到用戶端,系統(tǒng)開銷較大、響應(yīng)慢,只適用于特別頻繁的數(shù)據(jù)庫查詢操作。
4.JAVA/JDBC語言編程
JAVA語言是一種面向?qū)ο蟆⒁滓浦病⒍嗑€程控制的語言,可通過JDBC去連接數(shù)據(jù)庫。用JAVA/JDBC編寫的軟件可移植性強,適用于多種操作系統(tǒng),但其執(zhí)行效率和執(zhí)行速度還不理想,目前無法建立高效、高速的應(yīng)用。
5.動態(tài)服務(wù)器頁面ASP(ActiveServerPage)
ASP是微軟公司最新推出的WEB應(yīng)用開發(fā)技術(shù),著重于處理動態(tài)網(wǎng)頁和WEB數(shù)據(jù)庫的開發(fā),編程靈活、簡潔,具有較高的性能,是目前訪問WEB數(shù)據(jù)庫的最佳選擇。
二.ASP簡介
1.ASP訪問數(shù)據(jù)庫的原理
ASP是服務(wù)器端的腳本執(zhí)行環(huán)境,可用來產(chǎn)生和執(zhí)行動態(tài)的高性能的WEB服務(wù)器程序。
當用戶使用瀏覽器請求ASP主頁時,WEB服務(wù)器響應(yīng),調(diào)用ASP引擎來執(zhí)行ASP文件,并解釋其中的腳本語言(JScript或VBScript),通過ODBC連接數(shù)據(jù)庫,由數(shù)據(jù)庫訪問組件ADO(ActiveXDataObjects)完成數(shù)據(jù)庫操作,最后ASP生成包含有數(shù)據(jù)查詢結(jié)果的HTML主頁返回用戶端顯示。
由于ASP在服務(wù)器端運行,運行結(jié)果以HTML主頁形式返回用戶瀏覽器,因而ASP源程序不會泄密,增加了系統(tǒng)的安全保密性。此外,ASP是面向?qū)ο蟮哪_本環(huán)境,用戶可自行增加ActiveX組件來擴充其功能,拓展應(yīng)用范圍。
2.ASP頁面的結(jié)構(gòu):
ASP的程序代碼簡單、通用,文件名由.asp結(jié)尾,ASP文件通常由四部分構(gòu)成:
1)標準的HTML標記:所有的HTML標記均可使用。
2)ASP語法命令:位于<%%>標簽內(nèi)的ASP代碼。
3)服務(wù)器端的include語句:可用#include語句調(diào)入其它ASP代碼,增強了編程的靈活性。
4)腳本語言:ASP自帶JScript和VBScript兩種腳本語言,增加了ASP的編程功能,用戶也可安裝其它腳本語言,如Perl、Rexx等。
3.ASP的運行環(huán)境
目前ASP可運行在三種環(huán)境下。
1)WINDOWSNTserver4.0運行IIS3.0(InternetInformationServer)以上。
2)WINDOWSNTworkstation4.0運行PeerWebServer3.0以上。
3)WINDOWS95/98運行PWS(PersonalWebServer)。
其中以NTserver上的IIS功能最強,提供了對ASP的全面支持,是創(chuàng)建高速、穩(wěn)定的ASP主頁的最佳選擇。
4.ASP的內(nèi)建對象
ASP提供了六個內(nèi)建對象,供用戶直接調(diào)用:
1)Application對象:負責管理所有會話信息,可用來在指定的應(yīng)用程序的所有用戶之間共享信息。
2)Session對象:存貯特定用戶的會話信息,只被該用戶訪問,當用戶在不同WEB頁面跳轉(zhuǎn)時,Session中的變量在用戶整個會話過程中一直保存。Session對象需cookie支持。
3)Request對象:從用戶端取得信息傳遞給服務(wù)器,是ASP讀取用戶輸入的主要方法。
4)Response對象:服務(wù)器將輸出內(nèi)容發(fā)送到用戶端。
5)Server對象:提供對服務(wù)器有關(guān)方法和屬性的訪問。
6)ObjectContext對象:IIS4.0新增的對象,用來進行事務(wù)處理。此項功能需得到MTS(MicrosoftTranscationServer)管理的支持。
5.ASP的主要內(nèi)置組件:
1)AdRotator組件:用來按指定計劃在同一頁上自動輪換顯示廣告,用于WWW上日益重要的廣告服務(wù)。
2)BrowserCapabilities組件:確定訪問WEB站點的用戶瀏覽器的功能數(shù)據(jù),包括類型、性能、版本等。
3)DatabaseAccess組件:提供ADO(ActiveXDataObjects)來訪問支持ODBC的數(shù)據(jù)庫。
4)FileAccess組件:提供對服務(wù)器端文件的讀寫功能。
5)ContentLinking組件:生成WEB頁內(nèi)容列表,并將各頁順序連接,用于制作導航條。
此外,還可安裝Myinfo、Counters、ContentRotator、PageCount等組件,用戶也可自行編制Actiive組件,以提高系統(tǒng)的實用性。
6.DatabaseAccess組件ADO
WWW上很重要的應(yīng)用是訪問WEB數(shù)據(jù)庫,用ASP訪問WEB數(shù)據(jù)庫時,必須使用ADO組件,ADO是ASP內(nèi)置的ActiveX服務(wù)器組件(ActiveXServerComponent),通過在WEB服務(wù)器上設(shè)置ODBC和OLEDB可連接多種數(shù)據(jù)庫:如SYBASE、ORACLE、INFORMIX、SQLSERVER、ACCESS、VFP等,是對目前微軟所支持的數(shù)據(jù)庫進行操作的最有效和最簡單直接的方法。
ADO組件主要提供了以下七個對象和四個集合來訪問數(shù)據(jù)庫。
1)Connection對象:建立與后臺數(shù)據(jù)庫的連接。
2)Command對象:執(zhí)行SQL指令,訪問數(shù)據(jù)庫。
3)Parameters對象和Parameters集合:為Command對象提供數(shù)據(jù)和參數(shù)。
4)RecordSet對象:存放訪問數(shù)據(jù)庫后的數(shù)據(jù)信息,是最經(jīng)常使用的對象。
5)Field對象和Field集合:提供對RecordSet中當前記錄的各個字段進行訪問的功能。
6)Property對象和Properties集合:提供有關(guān)信息,供Connection、Command、RecordSet、Field對象使用。
7)Error對象和Errors集合:提供訪問數(shù)據(jù)庫時的錯誤信息。
三.ASP訪問數(shù)據(jù)庫步驟
在ASP中,使用ADO組件訪問后臺數(shù)據(jù)庫,可通過以下步驟進行:
1.定義數(shù)據(jù)源
在WEB服務(wù)器上打開“控制面板”,選中“ODBC”,在“系統(tǒng)DSN”下選“添加”,選定你希望的數(shù)據(jù)庫種類、名稱、位置等。本文定義“SQLSERVER”,數(shù)據(jù)源為“HT”,數(shù)據(jù)庫名稱為“HTDATA”,腳本語言采用Jscript。
2,使用ADO組件查詢WEB數(shù)據(jù)庫
1)調(diào)用Server.CreateObject方法取得“ADODB.Connection”的實例,再使用Open方法打開數(shù)據(jù)庫:
conn=Server.CreateObject(“ADODB.Connection”)
conn.Open(“HT”)
2)指定要執(zhí)行的SQL命令
連接數(shù)據(jù)庫后,可對數(shù)據(jù)庫操作,如查詢,修改,刪除等,這些都是通過SQL指令來完成的,如要在數(shù)據(jù)表signaltab中查詢代碼中含有“X”的記錄
sqlStr=“select*fromsignaltabwherecodelike‘%X%’”
rs=conn.Execute(sqlStr)
3)使用RecordSet屬性和方法,并顯示結(jié)果
為了更精確地跟蹤數(shù)據(jù),要用RecordSet組件創(chuàng)建包含數(shù)據(jù)的游標,游標就是儲存在內(nèi)存中的數(shù)據(jù)。
rs=Server.CreateObject(“ADODB.RecordSet”)
rs.Open(sqlStr,conn,1,A)
注:A=1讀取
A=3新增、修改、刪除
在RecordSet組件中,常用的屬性和方法有:
rs.Fields.Count:RecordSet對象的字段數(shù)。
rs(i).Name:第i個字段的名稱,i為0至rs.Fields.Count-1
rs(i):第i個字段的數(shù)據(jù),i為0至rs.Fields.Count-1
rs("字段名"):指定字段的數(shù)據(jù)。
rs.Record.Count:游標中的數(shù)據(jù)記錄總數(shù)。
rs.EOF:是否最后一條記錄。
rs.MoveFirst:指向第一條記錄。
rs.MoveLast:指向最后一條記錄。
rs.MovePrev:指向上一條記錄。
rs.MoveNext:指向下一條記錄。
rs.GetRows:將數(shù)據(jù)放入數(shù)組中。
rs.Properties.Count:ADO的ResultSet或Connection的屬性個數(shù)。
rs.Properties(item).Name:ADO的ResultSet或Connection的名稱。
rs.Properties:ADO的ResultSet或Connection的值。
rs.close():關(guān)閉連接。
4)關(guān)閉數(shù)據(jù)庫
conn.close()
四.查詢WEB數(shù)據(jù)庫舉例
下面這段示例程序是訪問SQLSERVER數(shù)據(jù)庫的signaltab表,表中有三個字段:code(代碼字段,字符型,3位),class(分類字段,字符型,10位),memo(備注字段,字符型,20位)。程序中數(shù)據(jù)源DSN:HT、用戶名:client、口令:passwd。
屏幕輸入頁面input.asp
<%@language=javascript%>