||
- \documentclass[%showframe%
- ]{oclh_doc}
- \usepackage{fix-cm}% fix of Computer Modern font DO NOT MOVE!!!
- \usepackage{calc}% simple arithmetic in expressions
- \usepackage{etoolbox}% some Latex interfaces
- \usepackage{longtable,multirow}% tables
- \usepackage{adjustbox,%
- placeins, % processing of float objects
- caption} %
- %
- % page geometry
- %
- \usepackage[
- top = 0.06734007\paperheight,
- bottom = 0.06734007\paperheight,
- right = 0.1190476\paperwidth,
- left = 0.0952381\paperwidth
- ]{geometry}
- %
- % language and fonts
- %
- \usepackage{amsmath,amsfonts,amssymb,xfrac}
- \usepackage[cmintegrals,cmbraces]{newtxmath}
- \usepackage{xltxtra,polyglossia,csquotes}
- \usepackage{verbatim,fancyvrb,framed}
- \usepackage{relsize}
- \setmainlanguage{russian}
- \setotherlanguage{english}
- \setkeys{russian}{babelshorthands=true}
- \defaultfontfeatures{Scale=MatchLowercase,Mapping=tex-text}
- \input{fonts/font_settings-IBM_Plex.tex}
- % \input{fonts/font_settings-Computer_Modern.tex}
- % \input{fonts/font_settings-my_fonts.tex}
- %
- % paragraphs and align
- %
- \usepackage{indentfirst}
- \frenchspacing\sloppy\raggedbottom
- \setlength{\parindent}{0.0604762\paperwidth}%
- %%%%% additional colontitles settings
- \RequirePackage{fancyhdr}
- \fancyhf{}\renewcommand{\headrulewidth}{0pt}
- \fancyfoot{}
- \fancyfoot[R]{\thepage}
- \pagestyle{fancy}
- %
- % index
- %
- \usepackage[xindy]{imakeidx}
- \makeindex[options = -C utf8 -M texindy -M index_style_and_order ]
- %
- % references
- %
- \RequirePackage{hyperref}
- \RequirePackage{xcolor}
- \definecolor{DarkBlue}{rgb}{0,0,0.5}
- \hypersetup{colorlinks=true, linkcolor={black},
- urlcolor =DarkBlue, citecolor={black}}
- %
- % lists
- %
- \usepackage{enumitem}
- \newenvironment{CodePar}%
- {\Verbatim[samepage=true,frame=single]}%
- {\endVerbatim}%
- %
- \newenvironment{CodeParWithCC}[1]
- {\Verbatim[samepage=true,frame=single,commandchars=#1]}
- {\endVerbatim}
- %
- \newenvironment{ImpNote}
- {\setlength{\parindent}{0.0604762\paperwidth}%
- \setlength{\LTleft}{\parindent}%
- \setlength{\LTpre}{\parsep}\setlength{\LTpost}{\parsep}%
- \begin{longtable}{|p{\linewidth-\tabcolsep-1\parindent}}
- \noindent\textsf{Важное замечание:}}
- {\end{longtable}}
- %
- \newcommand{\SetLenVarWithWidth}[2]{%
- \ifdefined #1 \else%
- \newlength{#1}%
- \fi%
- \settowidth{#1}{#2}%
- }%
- \newcommand{\NmCnvDescript}%
- {\addtolength{\leftskip}{0.0604762\paperwidth}%
- \setlength{\parindent}{-0.0604762\paperwidth}}%
- %
- \newcommand{\verbI}[1]{\textit{\Verb|#1|}}%
- \newcommand{\verbIU}[1]{\underline{\smash{\textit{\Verb|#1|}}}}
- \title{Библиотека OpenCL\_helpers}
- \author{hk@r4in.tk\\ mns@r4in.tk}
- \makeindex
- \begin{document}
- \maketitle
- \section{Вводная информация}
- Библиотека OpenCL\_helpers создана для облегчения программирования
- многопоточных приложений, использующих GPGPU (General-purpose computing on
- graphics processing units -- вычисления общего назначения на графических
- процессорах). Библиотека не перекрывает всех потребностей программирования
- приложений, использующих GPGPU, она написана для упрощения создания приложений
- использующих многоуровневый (иерархический) параллелизм на одном компьютере. То
- есть, она позволяет распараллеливать задачу на потоки (threads) на основном
- вычислительном устройстве (CPU), а затем задачу каждого треда распараллеливать
- на устройстве GPGPU, разбивая GPU-потоки на команды выполняющие разные задачи.
- При создании библиотеки предполагалось, что каждый CPU-поток использует
- отдельное устройство GPGPU, однако не запрещено использовать одно устройство
- GPGPU в двух и более CPU-потоках. Параллелизм на уровне CPU обеспечивается
- средствами POSIX Threads, параллелизм на уровне GPGPU обеспечивается средствами
- библиотеки.
- Библиотека состоит из четырёх частей, не все из которых прямо связаны с
- параллелизмом и которые могут использоваться независимо друг от друга.
- Первая часть это средства сборки программ OpenCL~(п.\ref{sec:buildutils}).
- Средства сборки позволяют собирать программы OpenCL из командной строки и
- просматривать результат без написания и запуска собственного приложения.
- Вторая часть~(п.\ref{sec:libraryusing}) это сами CPU-функции OpenCL\_helpers и
- синтаксис, позволяющий создавать заголовочные файлы~(headers) общие для CPU и
- GPGPU программ.
- Третья часть~(п.\ref{sec:memalloc}) восполняет недостаток средств управления
- памятью в OpenCL C вводя средства выделения и освобождения памяти GPGPU,
- диагностики кучи~(heap) и реинтерпретации~(cast) указателей~(pointers).
- Четвёртая часть~(п.\ref{sec:squadmodel}) -- GPGPU-функции, позволяющие
- организовывать параллелизм внутри GPGPU, разбивая все множество GPGPU-потоков на
- команды, занимающиеся выполнением отдельных задач.
- \subsection{Сборка и установка}
- \label{sec:build_n_install}
- \subsubsection{Требования}
- \label{subsec:prerequisites}
- Предполагается, что вы имеете:
- \begin{enumerate}[leftmargin=2\parindent]
- \item Компьютер с установленной ОС Linux.
- \item Установленный и работающий компилятор языка C.
- \item Установленную и доступную стандартную библиотеку языка C (libc).
- \item Установленное программное обеспечение OpenCL версии 1.2 или младше любого
- производителя.
- \end{enumerate}
- \subsubsection{Получение исходного кода библиотеки OpenCL\_helpers}
- \label{subsec:getting_source}
- Получить копию исходного кода библиотеки OpenCL\_helpers можно по адресу
- \href{https://ggs.void.r4in.tk/hk/OpenCL_helpers/archive/master.tar.gz}%
- {\Verb|https://ggs.void.r4in.tk/hk/OpenCL\_helpers/archive/master.tar.gz|}
- после чего распаковать полученный архив.
- Кроме того, при наличии установленной СКВ Git~(\href{https://git-scm.com}%
- {\Verb|https://git-scm.com|}) можно получить исходный код
- библиотеки OpenCL\_helpers командой\par
- \indent\indent\verb|git clone |%
- \href{https://ggs.void.r4in.tk/hk/OpenCL_helpers.git}%
- {\Verb|https://ggs.void.r4in.tk/hk/OpenCL\_helpers.git|}
- \subsubsection{Сборка}
- Для сборки по умолчанию необходимо перейти в каталог \verb|OpenCL_helpers| и
- выполнить команду
- \indent\indent\verb|make|
- \noindent%
- Допустимо использовать ключ \verb|-j| для многопоточной сборки. Если команда
- завершена без ошибок, то в каталоге \verb|OpenCL_helpers/build| появятся файлы:
- \par
- \indent\indent\verb|liboclh.so.|\verbI{I}\verb|.|\verbI{J}%
- \verb| oclh_br oclh_cr oclh_lr|\par
- \noindent%
- и несколько подкаталогов \verb|*.o| с объектами. В имени первого файла
- \verbI{I} -- майорная версия библиотеки, а \verbI{J} -- минорная. Каждый файл
- может быть собран отдельно командами:\par
- \indent\indent\verb|make oclh_library|\par
- \indent\indent\verb|make oclh_builder|\par
- \indent\indent\verb|make oclh_compiler|\par
- \indent\indent\verb|make oclh_linker|\par
- При необходимости возможна сборка для отладки (debug) командой\par
- \indent\indent\verb|make debug|
- \subsubsection{Установка}
- Установка осуществляется командой:\par
- \indent\indent\verb|make install|\par
- \noindent%
- В результате будет создан каталог \verb|~/opt/oclh|, куда в подкаталоги
- \verb|bin|, \verb|lib|, \verb|include| будут скопированы исполняемые файлы, файл
- библиотеки и заголовочные файлы соответственно. Затем целесообразно добавить
- каталог \verb|~/opt/oclh/bin| в переменную окружения \verb|PATH|, а каталог
- \verb|~/opt/oclh/lib| -- в переменную окружения \verb|LD_LIBRARY_PATH|.
- Можно изменить целевой путь если задать команду
- \indent\indent\verb|make PRFX_PATH=|\verbI{путь\_установки}\verb| install|
- \subsubsection{Удаление}
- Удаление производится командой
- \indent\indent\verb|make uninstall|
- \noindent%
- либо
- \indent\indent\verb|make PRFX_PATH=|\verbI{путь\_установки}\verb| uninstall|
- \noindent%
- если установка производилась не в каталог по умолчанию.
- \subsubsection{Документация}
- Документация библиотеки OpenCL\_helpers собирается отдельно. Для её сборки
- необходима система вёрстки \XeTeX /\XeLaTeX\ или иная \TeX /\LaTeX-система.
- Система \XeTeX\ и сопутствующие пакеты поставляются в составе дистрибутива \TeX
- ~Live~(\href{https://www.tug.org/texlive/}%
- {\Verb|https://www.tug.org/texlive/|}). Использование системы отличной от
- \XeTeX\ может потребовать внесения изменений в исходный код документации.
- Кроме непосредственно системы вёрстки понадобится ещё ряд пакетов, например,
- xindy для составления предметного указателя. Все использованные при составлении
- документации пакеты свободно доступны в составе дистрибутива \TeX ~Live.
- Сама сборка документации осуществляется из каталога
- \verb|OpenCL_helpers/documentation| запуском сценария сборки\par
- \indent\indent\verb|./build_script|\par
- \noindent%
- Если в ходе исполнения данного скрипта не возникло ошибок, то в каталоге
- \verb|OpenCL_helpers/documentation/build| появятся файлы\par
- \indent\indent\verb|opencl_helpers_documentation-russian.pdf|\par
- \indent\indent\verb|opencl_helpers_documentation-english.pdf|\par
- \noindent%
- с документацией на русском и английском языках соответственно.
- При сборке будут использованы шрифты семейства IBM~Plex, но можно вернуться к
- базовому семейству Computer~Modern просто раскомментировав строку\par
- \indent\indent\verb|\input{fonts/font_settings-Computer_Modern.tex}|\par
- \noindent в преамбуле исходного кода документации.
- \subsection{Формат файла-журнала}
- \label{subsec:logformat}
- \index{формат файла-журнала}%
- Средствами библиотеки можно вести файлы-журналы~(logs) о происходящих в
- приложении событиях, кроме того сама библиотека при необходимости будет
- осуществлять записи в файл(ы)-журналы. Описание функций журналирования
- дано~в~п.\ref{subsec:logfunctions}.
- Стандартная запись в файле журнале выглядит как
- \begin{CodeParWithCC}{\\\{\}}
- \textit{YYYY}-\textit{MM}-\textit{DD} \textit{hh}:\textit{mm}:\textit{ss} ws_0x\textit{HHHH} \textit{содержание_сообщения}
- \end{CodeParWithCC}
- \noindent где\par
- {%
- \setlength{\leftskip}{0pt}%
- \setlength{\LTpre}{\smallskipamount}\setlength{\LTpost}{\smallskipamount}%
- \setlength{\LTleft}{2\parindent-\tabcolsep}
- \SetLenVarWithWidth{\Acol}{\verbI{YYYY}}%
- \SetLenVarWithWidth{\Bcol}{--}%
- \begin{longtable}%
- {p{\Acol}p{\Bcol}p{\linewidth-\LTleft-\Acol-\Bcol-5\tabcolsep}}
- \verbI{YYYY}&--&год, записанный четырьмя десятичными цифрами;\\
- \verbI{MM}&--&месяц года, записанный двумя десятичными цифрами от 01 до 12;\\
- \verbI{DD}&--&день месяца, записанный двумя десятичными цифрами от 01 до 31;\\
- \verbI{hh}&--&час дня, записанный двумя десятичными цифрами от 00 до 23;\\
- \verbI{mm}&--&минута часа, записанная двумя десятичными цифрами от 00 до 59;\\
- \verbI{ss}&--&секунда минуты, записанная двумя десятичными цифрами от 00 до 59;
- \\
- \verbI{HHHH}&--&последние два байта адреса рабочей конфигурации устройства
- GPGPU~(workset,~подробнее~см.~п.\ref{subsec:structures}), записанные четырьмя
- шестнадцатеричными цифрами.
- \end{longtable}
- }\par
- \noindent%
- \verbI{содержание\_сообщения}~--~может быть любым текстом переданным функции
- журналирования, однако в коде самой библиотеки соблюдаются по возможности
- следующие соглашения:
- \begin{enumerate}
- \item Информация об объектах (сущностях) OpenCL записывается как
- \verbI{тип\_объекта}\verb|_0x|\verbI{HHHH}, где \verbI{HHHH}~--~последние два
- байта адреса объекта, записанные четырьмя шестнадцатиричными цифрами. Так,
- например, устройство GPGPU может быть записано как \verb|dev_0x2a78|, а
- платформа как \verb|platform_0xf190|. Исчерпывающий список сущностей OpenCL
- дан в спецификациях OpenCL.
- \item В качестве разделителей блоков информации в сообщении и маркирования
- относительности блоков используется символ <<\verb+|+>>. Так
- запись\nopagebreak
- \begin{CodePar}
- 2019-06-03 15:42:47 ws_0x9c00 context_0x9f60 | dev_0xf260 | ...
- \end{CodePar}
- обозначает, что сообщение относится к OpenCL-контексту \verb|0x9f60|,
- использующему устройство GPGPU \verb|0xf260|.
- \item В случае вывода в журнал информации, являющейся уточнением, перед ней
- ставится дополнительный пробел, например:\nopagebreak
- {\scriptsize
- \begin{CodePar}
- 2019-06-03 15:42:47 ws_0x9c00 context_0x9f60 | Reference count: 1
- 2019-06-03 15:42:47 ws_0x9c00 context_0x9f60 | Number of devices: 1
- 2019-06-03 15:42:47 ws_0x9c00 context_0x9f60 | Device ID(s): 0x1acf260
- 2019-06-03 15:42:47 ws_0x9c00 context_0x9f60 | dev_0xf260 | GPU: 15 units/17...
- 2019-06-03 15:42:47 ws_0x9c00 context_0x9f60 | dev_0xf260 | Memory: 8116.43...
- 2019-06-03 15:42:47 ws_0x9c00 context_0x9f60 | dev_0xf260 | Vendor: NVIDIA Corp...
- 2019-06-03 15:42:47 ws_0x9c00 context_0x9f60 | dev_0xf260 | Model: GeForce GT...
- 2019-06-03 15:42:47 ws_0x9c00 context_0x9f60 | Context properties:
- 2019-06-03 15:42:47 ws_0x9c00 context_0x9f60 | Platform: 0xf190
- 2019-06-03 15:42:47 ws_0x9c00 context_0x9f60 | platform_0xf190 | Profile: FULL_PROFILE
- 2019-06-03 15:42:47 ws_0x9c00 context_0x9f60 | platform_0xf190 | Version: OpenCL 1...
- 2019-06-03 15:42:47 ws_0x9c00 context_0x9f60 | platform_0xf190 | Name: NVIDIA CUDA
- 2019-06-03 15:42:47 ws_0x9c00 context_0x9f60 | platform_0xf190 | Vendor: NVIDIA Corp...
- 2019-06-03 15:42:47 ws_0x9c00 context_0x9f60 | platform_0xf190 | Extensions: cl_khr...
- 2019-06-03 15:42:47 ws_0x9c00 context_0x9f60 | Is user responsible for sync: Undefined (presumable No)
- \end{CodePar}
- }
- \item В случае возникновения ошибки при выполнении функции библиотеки в
- журнал будет добавлена запись, начинающаяся с \verb|oclerr:| и содержащая
- информацию о всех вызовах функций начиная с библиотечного и до OpenCL API. Так
- сообщение в журнале:\nopagebreak
- \begin{CodeParWithCC}{\\\{\}}
- \textit{YYYY}-\textit{MM}-\textit{DD} \textit{hh}:\textit{mm}:\textit{ss} ws_0x\textit{HHHH} oclerr:
- _ghf_getBuildStatus/clGetProgramBuildInfo/CL_PROGRAM_BUILD_STATUS
- returned error -3 - CL_COMPILER_NOT_AVAILABLE
- \end{CodeParWithCC}
- значит, что функция \verb|_ghf_getBuildStatus| вызвала функцию OpenCL API
- \verb|clGetProgramBuildInfo| с аргументом \verb|CL_PROGRAM_BUILD_STATUS| и
- получила в ответ ошибку с кодом \verb|-3|, которая обозначает
- \verb|CL_COMPILER_NOT_AVAILABLE|.
- \end{enumerate}
- Учитывая, что для одного запуска приложения адреса сущностей OpenCL уникальны,
- то с высокой вероятностью сочетание названия объекта и двух последних байт
- адреса тоже уникально. Поэтому использование этих соглашений позволяет с помощью
- фильтрации подстроки получить из файла-журнала необходимую информацию по
- отдельному объекту OpenCL.
- Кроме стандартной записи файла журнала существует ещё запись-заголовок, которая
- выглядит как\par
- {\small%
- \begin{CodeParWithCC}{\\\{\}}
- \textit{YYYY}-\textit{MM}-\textit{DD} \textit{hh}:\textit{mm}:\textit{ss} ws_0x\textit{HHHH} _______________
- \textit{YYYY}-\textit{MM}-\textit{DD} \textit{hh}:\textit{mm}:\textit{ss} ws_0x\textit{HHHH} \textit{Текст_заголовка}
- \textit{YYYY}-\textit{MM}-\textit{DD} \textit{hh}:\textit{mm}:\textit{ss} ws_0x\textit{HHHH} ~~~~~~~~~~~~~~~
- \end{CodeParWithCC}
- }\par
- \noindent и запись-разделитель\par
- {\small%
- \begin{CodeParWithCC}{\\\{\}}
- \textit{YYYY}-\textit{MM}-\textit{DD} \textit{hh}:\textit{mm}:\textit{ss} ws_0x\textit{HHHH} ____________________________________________________
- \textit{YYYY}-\textit{MM}-\textit{DD} \textit{hh}:\textit{mm}:\textit{ss} ws_0x\textit{HHHH} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
- \end{CodeParWithCC}
- }
- \input{name_conventions-russian.tex}
- \section{Средства сборки программ OpenCL}
- \label{sec:buildutils}
- В состав библиотеки входят три исполняемых файла:\nopagebreak\par
- \begin{itemize}[leftmargin=1.75\parindent]
- \item\verb|oclh_cr| -- осуществляет компиляцию программы OpenCL в объект
- OpenCL;
- \item\verb|oclh_lr| -- осуществляет компоновку объектов OpenCL;
- \item\verb|oclh_br| -- осуществляет полную сборку программы OpenCL.
- \end{itemize}\nopagebreak\par
- Во время работы этих программ ведётся подробный диагностический журнал в файле
- \verb|oclh_*r.log| (соответственно названию программы), куда сохраняется
- избыточная информация обо всех доступных устройствах GPGPU, используемых
- платформах и созданных для сборки контекстах. Фактически вы можете запустить,
- например, \verb|oclh_сr| с любым входным файлом, даже с самим собой, как
- \verb|./oclh_сr oclh_сr|. Файл, конечно, не будет собран в объект OpenCL, но в
- журнале \verb|oclh_сr.log| останется полная информация по устройствам GPGPU,
- найденным в системе. Формат журнала человекочитаем, адаптирован к поиску
- подстрок с использованием команды \verb|grep| и аналогов. Формат файла-журнала
- описан в п.\ref{subsec:logformat}.
- Рассмотрим варианты использования каждой из этих программ.
- \input{tools_compiler-russian.tex}
- \input{tools_linker-russian.tex}
- \input{tools_builder-russian.tex}
- \section{Использование библиотеки OpenCL\_helpers. Структуры, функции и
- заголовки}
- \label{sec:libraryusing}
- Заглушка. Раздел будет оформлен после достаточного тестирования
- функциональности.
- \subsection{Структуры}
- \label{subsec:structures}
- Заглушка. Раздел будет оформлен после достаточного тестирования
- функциональности.
- \subsubsection{Основная структура рабочей конфигурации}
- \label{subsec:workset}
- Заглушка. Раздел будет оформлен после достаточного тестирования
- функциональности.
- \subsection{Функции журналирования}
- \label{subsec:logfunctions}
- Заглушка. Раздел будет оформлен после достаточного тестирования
- функциональности.
- \subsection{Общие для CPU и GPGPU кода заголовочные файлы}
- \label{subsec:sharedheaders}
- Заглушка. Раздел будет оформлен после достаточного тестирования
- функциональности.
- \section{Управление памятью и реинтерпретация указателей в программах OpenCL C}
- \label{sec:memalloc}
- Заглушка. Раздел будет оформлен после достаточного тестирования
- функциональности.
- \section{Параллелизм внутри GPU}
- \label{sec:squadmodel}
- Заглушка. Раздел будет оформлен после достаточного тестирования
- функциональности.
- \let\originalstyle=\thispagestyle
- \def\thispagestyle#1{}
- \printindex
- \let\thispagestyle=\originalstyle
- \tableofcontents
- \end{document}
|