--- layout : post title : "Jupyter——Code, note and data presentation platform" subtitle : "代码,笔记以及数据展示平台" date : 2022-09-09 08:48:32 author : "Manford Fan" catalog : false header-img : "img/post-bg-universe.jpg" tags : - Python - Jupyter - Ipython --- 距离上次记录已经有两个月的时间了,这是艰难的两个月,中间发生了很多很多事情,搞得整个人身心俱疲。好在时间是最好的医生,可以抚平所有的不快乐,也能让人看清楚现实,拍拍屁股,继续向前走。很早之前就听说过Jupyter,之前LY上课的时候说老师推荐他们用这个,前段时间支援ECX的时候,LYB也在自己的黑群晖上建了一个给我用,当时我还是用不习惯,说还是PyCharm好用,直到现在也觉得PyCharm好用,只不过在不同应用场景下,Jupyter优势还是很明显的。 ## 一、Jupyter Notebook/Lab 简介 Jupyter Notebook: 经典的笔记交互界面。Jupyter Notebook是最原始的网页应用,它被用来创建和分享计算标注文档,并提供简洁,易于理解的以为当为中心的代码体验。其可被应用于全过程计算:开发、文档编写、运行代码和展示结果。 Jupyter Lab: 下一代的笔记交互界面。Jupyter Lab是最新的基于网页的用于交互计算的应用程序,它可以是笔记,代码和数据融合的交互式开发环境。这种灵活的交互界面允许用户按照自己的习惯来进行大数据分析,科学计算,机器学习的流程按安排和配置。符合潮流的模块化设计,使得Jupyter Lab具有丰富的功能和高度的可扩展性。 由此可见,Jupiter Lab是Jupiter Notebook的升级版,前者是后者的超集,而且官方也明确说后续会使用前者替代后者,所以一步到位,这次我们使用Jupyter Lab作为工作环境。 ## 二、安装在线服务 安装Jupyter Lab在线服务分为环境准备,服务安装以及多用户配置是三个部分,其中服务安装配置完成之后,可以直接使用IP:Port的形式直接访问,也可以使用Nginx做一个反向代理,让该服务以域名的形式出现,显得更加简洁。 #### 1. 环境准备 这里主要准备了Python3的运行环境,升级更新了*pip*和*setuptools*这两个系统工具(不更新有可能会报错);另外安装过程中可能会提示如下不建议使用root账号来使用*pip*的建议,这里也选择了忽略,个人环境无所谓,企业环境中还是最好使用非root账号;在一个就是需要安装*ipython*,因为无论是notebook还是lab环境用的都是*ipython*。 > WARNING: Running pip as the 'root' user can result in broken permissions and conflicting behaviour with the system package manager. It is recommended to usea virtual environment instead: https://pip.pypa.io/warnings/venv ```bash apt install python3-pip python3-dev pip3 install --upgrade setuptools pip3 install --upgrade pip pip3 install ipython ``` #### 2. 服务安装与配置 以*jupyterlab*为例,安装的过程是很简单的,但是可能会需要点时间,安装完成之后需要设定密码,生成配置文件,然后将默认的配置文件根据下面的提示修改一下,就可以直接运行了。 ```bash pip3 install jupyterlab jupyter lab password jupyter lab --generate-config # c.ServerApp.ip = '0.0.0.0' # c.ServerApp.port = 8000 # c.ServerApp.open_browser = False # c.ServerApp.root_dir = '/xxxx/xxxx/xxx' # c.ServerApp.password_required = True # c.ServerApp.password = 'xxxxxxx' ``` 如果想要了解更多的用法,可以在命令行运行`jupyter lab --help`命令,在安装配置的过程中,需要注意如下几点: 1. 如果以root用户运行的话,需要加上 `--allow-root`选项 2. 如果是多用户使用的话,需要使用`--config + 配置文件`选项指定配置文件路径 3. 有些系统Python3的模块管理工具是`pip`,有些是`pip3`,以实际为准 4. 如果需要其他模块,可以在服务端直接用`pip`安装,然后在Jupiter Lab中就可以直接使用了 5. 配置Nginx反向代理的话需要区分不同路径,比如*terminal/api*,具体可参考如下 ```nginx server { server_name jupyter.rustle.cc; listen [::]:443 ssl http2; listen 443 ssl http2; listen [::]:80; listen 80; charset utf-8; access_log logs/jupyter.access.log main; location / { proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; proxy_set_header Host $http_host; proxy_redirect off; proxy_set_header Cache-Control no-cache; proxy_pass http://localhost:8922; } location ~ /api/kernels/ { proxy_pass http://localhost:8922; proxy_set_header Host $http_host; proxy_http_version 1.1; # websocket support proxy_set_header Upgrade "websocket"; proxy_set_header Connection "Upgrade"; proxy_read_timeout 86400; } location ~ /terminals/ { proxy_pass http://localhost:8922; proxy_set_header Host $http_host; proxy_http_version 1.1; # websocket support proxy_set_header Upgrade "websocket"; proxy_set_header Connection "Upgrade"; proxy_read_timeout 86400; } } ``` #### 3. 多用户配置 很多时候搭建了一个服务是给很多人使用的,有些具有私密性或者安全性敏感的,就按需开放,这个时候就需要设置不同的账号密码,而Jupyter没有账号,或者说在哪个账户下运行的服务,账号默认就是这个账户的名字,所以只需将原来的配置文件**jupyter_lab_config.py**复制一个副本,修改设定不同的登录密码以及端口即可,密码的生成有如下两种方式: > **方式1:使用命令行** 在命令行中直接运行`jupyter lab password`,会有输入密码的提示,连续输入两次相同的密码,Jupyter就会再次提示你,密码的hash值已经被写入如下文件。然后打开制定的文件,发现是键值对的形式,将其中的值的部分,复制到**/home/manford/.jupyter/jupyter_lab_config.py**配置文件中*c.ServerApp.password*字段。 ```bash [ 0 root@ECX ~]$ jupyter lab password Enter password: Verify password: [JupyterPasswordApp] Wrote hashed password to /home/manford/.jupyter/jupyter_server_config.json ``` > **方式2:使用Python模块** 在命令行中输入`python3`之后进入python的控制台环境,然后使用**notebook.auth**模块生成密码,最后和第一种方法一样,将生成hash值形式的密码,填到**jupyter_lab_config.py**配置文件中的*c.ServerApp.password*字段即可。 ```python [ 0 root@ECX ~]# python3 Python 3.7.3 (default, Jan 22 2021, 20:04:44) [GCC 8.3.0] on linux Type "help", "copyright", "credits" or "license" for more information. >>> from notebook.auth import passwd >>> passwd() Enter password: Verify password: 'argon2:$argon2id$v=19$m=10240,t=10,p=8$Y+LaIGe/37+rQSFoWgwPUA$7K/vd8b01i7NpZXdQDXK5y1WLysUaNZg/ypz1OBFxX0' >>> exit() ``` 密码准备好了之后,还有一个地方需要修改,配置文件**jupyter_lab_config.py**中的字段*c.ServerApp.port*值需要修改成和之前端口不一样的值,然后运行`jupyter lab --allow-root --config $PATH-TO-YOUR-CONF`。 ## 三、使用示例 Jupyter Lab作为Jupyter Notebook的升级改造版,除了更加人性化的交互界面以及更多的用户自主定制功能之外,最吸引人的就是其丰富多样的拓展插件,使得每个使用Jupyter Lab的人都可以按照自己所需挑选安装插件,组合出自己心中的完美工作台。如下是安装好打开之后的界面,可以在最左边的侧边栏最后一个按钮处启用并安装扩展程序。 #### 1. 界面要素简介 如下图所示,Jupyter Lab分为三大块——菜单栏,左侧工作区,右侧启动区。布局比较清晰简洁,多操作几次就可以很熟练地使用了。
#### 2. 编辑/命令模式 众所周知,`vim`有编辑模式,命令模式以及视图模式,Jupiter也有编辑模式和命令模式,感觉和`vim`的操作方式大同小异,也是按`ESC`切换成命令模式,相比于`vim`,因为Jupyter是图形界面,编辑模式好理解的多 #### 3. 快捷键 不仅像`vim`有编辑模式和命令模式,在快捷键的设计方面,感觉Jupyter Lab也和`vim`的设计靠拢,这对于开发者无疑是利好的消息,学习成本可以降低一些。熟练使用快捷键可以一定程度上提高自己的开发效率,降低维护成本,对于一般使用者而言,也仅仅是方便一些。 |快捷键|功能描述| |:-|:-| |[Insert]ESC|进入命令模式| |[Insert]Shift + Enter|运行当前Cell代码| |[Insert]Ctrl + Enter|运行当前Cell代码| |[Insert]Alt + Enter|运行当前Cell代码。并插入下一行| |[Command]A|在当前单元格上面插入代码块| |[Command]B|在当前单元格下面插入代码块| |[Command]Y|修改单元格为代码格式| |[Command]M|修改单元格为Markdown格式| |[Command]X|剪切选中的单元格| |[Command]C|复制选中的单元格| |[Command]V|粘贴选中的单元格| |[Command]|向上移动以切换单元格| |[Command]|向下移动以切换单元格| |[Command]Z|撤销之前的操作| |[Command]Shift + Z|重做之前撤销的操作| |[Command]D + D|删除当前行或者选中的行| |[Command]Shift + 鼠标左键|多选单元格,不支持跨行多选| |[Command]Shift + M|合并多选的单元格| |[Command]Shift + Backspace|合并当前和其上的单元格| |[Command]Shift + Shift + M|合并当前和其下的单元格| |[Insert]Shift + Shift + -|以当前鼠标位置,拆分成两个单元格| 以上是比较常用的快捷键,更多的操作可以使用Ctrl + ,打开高级设置,找到**Keyboard Shortcuts**条目查看。 #### 4. 魔法函数 使用魔法函数可以简单的实现一些单纯python要很麻烦才能实现的功能,如下是Python Kernel中适用的一些魔法函数,都是一些个人觉得比较常用的。Ipython的魔法命令分*line magic*和*cell magic*两种: - *line magic*:是只针对当前行生效的方法,使用魔法命令时只需要用'%'前缀 - *cell magic*:是针对当前整个代码输入框生效的方法,使用魔法命令时只需要用'%%'前缀 |魔法函数|功能描述| |:-|:-| |%lsmagic|列出所有魔法命令| |%magic|列出所有魔法命令的详细用法| |%cd PATH|切换工作目录| |%%writefile filename|将当前cell的内容保存到文件| |%%markdown|以Markdown渲染当前cell| |%%latex|以latex渲染当前cell| |%%js|以js渲染当前cell| |%%html|以html渲染当前cell| |%%bash|在子进程中用bash执行当前cell| |%time|%time统计单行python语句的执行时间,%%time,统计当前cell的执行时间| |%system|执行shell命令,并且捕获输出| |%pwd|查看当前工作目录| |%pip|执行pip命令| |%matplotlib|%matplotlib inline,在cell 的执行结果中显示matplotlib绘制的图像| |%pdef|查看某个可调用对象的接口说明| |%pdoc|查看某个对象的docstring| |%pfile|查看某个对象在哪个文件中被定义| |%load filename|加载代码到当前前端,如%load myscript.py| > 要查看某个魔法命令的用法,可以使用"%{命令名}?",也就是在命令名后加一个问号 #### 5. 其他 Jupyter Lab还有很多其他的小技巧,有用但是并不复杂,一并汇总在这里。 - 按tab键查看提示信息或者补全命令(Lab不需要安装插件) - 在一个库、方法或变量前加上`?`,就可以获得它的一个快速语法说明 - 使用分号可以阻止该行命令或者函数的结果输出 - 可以用Edit→Clear (All) Output(s)清除已经输出的结果 - 可以手动拖动Cell以改变单元格顺序 > *matplotlib* 中文字体问题 网络上以及官方给出了很多解决方案,这里只记录其中一种可以解决问题的方法: 1. 在Windows11的"C:\Windows\Fonts"路径下找到一款喜欢的中文字体 2. 将其复制到一个指定文件夹,比如:/opt/config/font/simhei.ttf 3. 在代码块中指定引用 ```python from matplotlib import font_manager my_font = font_manager.FontProperties(fname="/opt/config/font/simhei.ttf") plt.xlabel("时间", fontproperties = my_font) ``` ## 四、参考文档 - [Project Jupyter \| Home](https://jupyter.org/) - [JupyterLab Documentation](https://jupyterlab.readthedocs.io/en/stable/)