Preview

Бюллетень Почвенного института имени В.В. Докучаева

Расширенный поиск

Крупномасштабное цифровое картографирование содержания органического углерода почв с помощью методов машинного обучения

https://doi.org/10.19047/0136-1694-2018-91-46-62

Аннотация

Приведены результаты цифрового картографирования содержания органического углерода в пахотных горизонтах почв и оценки точности получаемых моделей с использованием методов машинного обучения для участка Среднерусской возвышенности Воронежской области. Цифровое картографирование основывалось на 22 точках почвенного опробования, используемых для обучения и проверки моделей, а также на нескольких наборах переменных-предикторов, в качестве которых выступали цифровая модель рельефа, производные от нее и данные дистанционного зондирования различного пространственного разрешения. Для построения моделей пространственного варьирования исследуемого свойства использовали несколько методов, основанных на деревьях решений: ансамбль деревьев решений, бустинг регрессионных деревьев и байесовские регрессионные деревья. Оценку точности полученных картографических моделей определяли методом перекрестной проверки, при этом в качестве показателей точности использовали коэффициент детерминации, среднюю абсолютную ошибку и корень среднеквадратичной ошибки. По результатам моделирования выявлено, что с использованием переменных-предикторов, представленных цифровой моделью рельефа, ее производными и данными Landsat 8 удалось получить более устойчивые модели, причем коэффициент детерминации изменяется от 0.6 до 0.7, RMSEcv, т.е. ошибка прогноза от 0.5791 до 0.6520. Лучшая модель получена с помощью метода байесовских регрессионных деревьев; тогда как для переменных-предикторов, представленных цифровой моделью рельефа, ее производными и данными Sentinel 2 - от 0.47 до 0.55, ошибка прогноза от 0.7031 до 0.7909. Выявлено, что в описанных моделях по различным наборам данных наиболее значимыми оказывались разные переменные-предикторы.

Об авторах

А. В. Чинилин
РГАУ-МСХА им. К.А. Тимирязева
Россия


И. Ю. Савин
Почвенный институт им. В.В. Докучаева
Россия


Список литературы

1. Добровольский Г.В., Урусевская И.С. География почв. М.: Изд-во Моск. ун-та, 2015. 458 c.

2. Жоголев А.В. Актуализация региональных почвенных карт на основе спутниковых и геоинформационных технологий (на примере Московской области): Автореф. дис.. к. с.-х. н. М., 2016. 22 c.

3. Савин И.Ю., Прудникова Е.Ю. Об оптимальном сроке спутниковой съемки для картографирования пахотных почв // Бюл. Почв. ин-та им. В.В. Докучаева. 2014. № 74. С. 66-77.

4. Флоринский И.В. Гипотеза Докучаева - центральная идея цифрового прогнозного почвенного картографирования (к 125-летию публикации). Почвоведение. 2012. № 4. С. 500-506.

5. Arrouays D., Savin I., Leenaars J., McBratney A.B. (eds.) GlobalSoilMap - Digital Soil Mapping from Country to Globe. Balkem: CRC Press, 2018. 174 p.

6. Arrouays D., McKenzie N., Hempel J., Richer de Forges A., McBratney A. GlobalSoilMap: basis of the global spatial soil information system. Balkem: CRC Press, 2014. 494 p.

7. Breiman L. Random Forests // Machine Learning. 2001. № 1 (45). C. 5-32. doi: 10.1023/A:1010933404324

8. Bui E.N., Henderson B.L., Viergever K. Knowledge discovery from models of soil properties developed through data mining // Ecological Modelling. 2006. № 3 (191). C. 431-446. doi: 10.1016/j.ecolmodel.2005.05.021

9. Chen T., Guestrin C. XGBoost: A Scalable Tree Boosting System // Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2016. 785-794 с. doi: 10.1145/2939672.2939785

10. Chipman H.A., George E.I., McCulloch R.E. BART: Bayesian additive regression trees // The Annals of Applied Statistics. 2010. № 1 (4). C. 266-298. doi: 10.1214/09-AOAS285

11. Conrad O., Bechtel M., Bock M., Dietrich H., Fischer E. System for Automated Geoscientific Analyses (SAGA) v. 2.1.4 // Geoscientific Model Development. 2015. № 7 (8). C. 1991-2007. doi: 10.5194/gmd-8-1991-2015

12. Gobin A. Participatory and spatial-modeling methods for land resources analysis. PhD thesis. Katholik Universiteit, Leuven, 2000. 282 c.

13. Grinand C., Arrouays D., Laroche D., Martin M.P. Extrapolating regional soil landscapes from an existing soil map: Sampling intensity, validation procedures, and integration of spatial context // Geoderma. 2008. № 1 (143). C. 180-190. doi: 10.1016/j.geoderma.2007.11.004

14. Hengl T., Heuvelink G.B.M., Kempen B., Leenaars J.G.B., Walsh M. Mapping Soil Properties of Africa at 250 m Resolution: Random Forests Significantly Improve Current Predictions // PLOS ONE. 2015. № 6 (10). C. e0125814. doi: 10.1371/journal.pone.0125814

15. Hengl T., Mendes de Jesus J., Heuvelink G.B.M., Ruiperez Gonzalez M., Kilibarda M. SoilGrids250m: Global gridded soil information based on machine learning // PLOS ONE. 2017. № 2 (12). C. e0169748. doi: 10.1371/journal.pone.0169748

16. Hengl T., Leenaars K., Shepherd K.D., Walsh M., Heuvelink G.B.M. Soil nutrient maps of Sub-Saharan Africa: assessment of soil nutrient content at 250 m spatial resolution using machine learning // Nutrient Cycling in Agroecosystems. 2017. № 1 (109). C. 77-102. doi: 10.1007/s10705-017-9870-x

17. Jenny H. Factors of Soil Formation // Soil Science. 1941. № 5 (52). C. 415. doi: 10.1097/00010694-194111000-00009

18. Kuhn M. Building Predictive Models in R Using the caret Package // Journal of Statistical Software. 2008. № 5 (28). doi: 10.18637/jss.v028.i05

19. Lagacherie P., Holmes S. Addressing geographical data errors in a classification tree for soil unit prediction // International Journal of Geographical Information Science. 1997. № 2 (11). C. 183-198. doi: 10.1080/136588197242455

20. McBratney A., Mendonça Santos M., Minasny B. On digital soil mapping // Geoderma. 2003. № 1-2 (117). C. 3-52. doi: 10.1016/S0016-7061(03)00223-4

21. Minasny B., McBratney A.B. A conditioned Latin hypercube method for sampling in the presence of ancillary information // Computers & Geosciences. 2006. № 9 (32). C. 1378-1388. doi: 10.1016/j.cageo.2005.12.009

22. Core R., Team R. A language and environment for statistical computing // 2016.

23. Sollich P., Krogh A. Learning with ensembles: How overfitting can be useful, Proceedings of the 1995 Conference, Vol. 8, 1996. 190-196 с.

24. Taghizadeh-Mehrjardi R., Minasny B., McBratney A.B., Triantafilis J. Digital soil mapping of soil classes using decision trees in central Iran // Proceedings of the 5th Global Workshop on Digital Soil Mapping, 2012. C. 197-202. doi: 10.1201/b12728-40

25. Vermote E., Justice C., Claverie M., Franch B. Preliminary analysis of the performance of the Landsat 8/OLI land surface reflectance product // Remote Sensing of Environment. 2016. № 185. C. 46-56. doi: 10.1016/j.rse.2016.04.008


Рецензия

Для цитирования:


Чинилин А.В., Савин И.Ю. Крупномасштабное цифровое картографирование содержания органического углерода почв с помощью методов машинного обучения. Бюллетень Почвенного института имени В.В. Докучаева. 2018;(91):46-62. https://doi.org/10.19047/0136-1694-2018-91-46-62

For citation:


Chinilin A.V., Savin I.Yu. The large scale digital mapping of soil organic carbon using machine learning algorithms. Dokuchaev Soil Bulletin. 2018;(91):46-62. (In Russ.) https://doi.org/10.19047/0136-1694-2018-91-46-62

Просмотров: 995


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 0136-1694 (Print)
ISSN 2312-4202 (Online)