信息技術的快速發展,特别是信息獲取技術、信息物理系統、互聯網、物聯網、社交網絡等突飛猛進,引發了數據規模的爆炸式增長。能源、制造業、交通運輸業、服務業、科教文化、醫療衛生等領域都積累了TB級、PB級乃至EB級的大數據。這些大數據已經開始造福于人類,成為信息社會的重要财富。大數據蘊含着巨大的價值,對社會、經濟、科學研究等各個方面都具有重要的戰略意義,為人們更深入地感知、認識和預測物理世界提供了前所未有的豐富信息。由于大數據的迅速湧現及其蘊藏的巨大價值,已引起國内外學術界、工業界和政府部門的廣泛關注。
伴随數據的爆炸式增長,數據質量問題也随之而來,劣質數據的存在,極大地降低了數據可用性。事實表明,大數據在可用性方面存在嚴重問題(以下簡稱數據可用性問題)。國外權威機構的統計表明,美國企業信息系統中1%~30%的數據存在各種錯誤和誤差,美國醫療信息系統中13.6%~81%的關鍵數據不完整或陳舊。國際著名科技咨詢機構Gartner的調查顯示,全球财富1000強企業中超過25%的企業信息系統中的數據不正确或不準确。可以預見,随着大數據應用的不斷擴大,數據可用性問題将日趨嚴重,也必将導緻源于數據的知識和決策的嚴重錯誤。
大數據可用性已經成為國内外學術界、産業界和用戶普遍關注的熱點問題,在國内外掀起了一個空前的研究熱潮。專刊選題為“大數據可用性理論、方法和技術”,将突出目前大數據可用性研究中的熱點技術,如大數據可用性基礎理論、數據獲取過程中的可用性問題、錯誤自動檢測與修複、弱可用數據(指不完整數據、不一緻數據、不精确數據、時效性錯誤數據等)上的知識發現與近似計算,不确定知識的演化與管理等等。
本專刊将收錄國内外大數據可用性研究領域中具有創新性和突破性的高水平研究成果,深入探讨其理論、方法與技術。專刊将于2016年第**期出版,讀者群體包括數據庫、數據挖掘、機器學習、體系結構、統計學等多領域的研究人員和工程人員等。
專刊題目:大數據可用性理論、方法和技術
特約編輯:李建中(哈爾濱工業大學) 、杜小勇(中國人民大學)
出版時間:2016年第7期
一、征文範圍
本專刊的内容包括但不限于:
1) 大數據質量問題的基礎理論
2) 高質量大數據采集和預處理的算法與技術
3) 量質融合的大數據存儲管理模型、技術與系統
4) 大數據中不完整、不精确、不一緻等錯誤的自動發現與修複
5) 大數據中實體識别算法與技術
6) 弱可用數據上的數據挖掘與知識發現
7) 弱可用數據上的近似計算理論與方法
8) 不确定知識庫的基礎理論
9) 不确定知識庫的演化
10) 大數據量質融合管理系統平台與原型該系統
二、投稿要求
1. 投稿方式:采用"軟件學報在線投稿系統"(http://www.jos.org.cn)投稿。投稿時稿件類型請選擇“專刊投稿”,同時在中文标題後面加上括号,在括号内注明專刊名稱,即:(大數據可用性理論、方法和技術)。
2. 稿件格式:參照《軟件學報》論文格式(網站上提供了論文模版,可下載)。
3. 投稿文章未在正式出版物上發表過,也不在其他刊物或會議的審稿過程中,不存在一稿多投現象;保證投稿文章的合法性(無抄襲、剽竊、侵權等不良行為)。
4. 其他事項請參閱投稿指南 http://www.jos.org.cn/ch/reader/view_fixed_content.aspx?id=instructions
5. 投稿作者需提交投稿聲明;專刊投稿文章不收審理費。錄用刊發文章收取軟件學報标準版面費。發表之後,将按軟件學報标準支付稿酬,并贈送樣刊。
三、重要時間
截稿時間:2015年9月25日
錄用通知時間:2016年1月10日
提交修改稿時間:2016年1月20日
出版時間:2016年第7期
軟件學報編輯部
2015年5月11日