- 计算机视觉实战:基于TensorFlow 2
- (法)本杰明·普朗什 艾略特·安德烈斯
- 936字
- 2025-02-25 10:28:52
译者序
近年来,在深度学习技术的推动下,计算机视觉技术在众多人工智能技术中率先成熟,被广泛用于车牌识别、人物检测、视频安防等诸多领域。计算机视觉成为深度学习领域中热门的技术方向之一,在图像分类、目标检测、情感分析、语义分割方面总有新的算法、神经网络结构和技术出现,智能处理能力不断提升。
特征选择和处理是计算机视觉领域的关键技术之一,早期一般采用人工方法构建特征(比如纹理、颜色、物体等底层特征),然后使用规则、机器学习等方法,根据这些特征判断并识别图像和视频中的任务、场景或者活动等高层语义。由于各类应用场景的特征难以统一定义,底层特征和高层语义之间的鸿沟无法有效弥补,传统的计算机视觉技术受到一定的限制,没有得到广泛应用。
随着深度学习技术的兴起、计算机运算能力的不断提升和数据集的日益完善,深度神经网络可以自动抽取底层视觉特征,并与高层语义关联,从而实现端到端的图像与视频的智能分析和检测,大大降低了计算机视觉应用的算法设计难度。特别是随着TensorFlow等神经网络框架的开源和普及,有大量的典型神经网络结构和优化算法可供使用,计算机视觉应用的工程开发难度进一步降低。很多优秀的神经网络结构和算法都有TensorFlow版本的开源实现。现在,越来越多的研究人员和软件工程师使用TensorFlow进行计算机视觉相关的研究与应用开发工作,使得TensorFlow社区的力量不断增强。近期发布的TensorFlow 2引入了很多新特性,让深度神经网络的设计和开发更加容易。本书是使用TensorFlow 2进行计算机视觉开发的实用指南,作者基于深厚的理论功底和丰富的实践经验,深入浅出地介绍了计算机视觉和神经网络、TensorFlow基础和模型训练、现代神经网络等知识,并结合最新进展和应用案例,介绍了VGG、GoogLeNet、ResNet、YOLO、R-CNN、U-Net等先进神经网络结构。通过阅读本书,读者可以掌握神经网络的理论知识,学习解决计算机视觉问题的方法,并能够着手解决一些高级计算机视觉问题。我们相信读者一定会收获颇丰。
最后,感谢本书的作者本杰明·普朗什和艾略特·安德烈斯,感谢他们精彩的作品和辛勤的工作。感谢机械工业出版社华章公司的编辑,是他们的信任和支持使得本书中文版能与读者见面。感谢家人的理解和帮助。尽管我们努力准确、简洁地表达作者的观点和方法,但仍难免有词不达意之处。译文中的错误和不当之处,敬请读者朋友不吝指正。
译者
2021年6月