跳到主要内容

从0到1搭建前端异常监控系统

您将 Get 的技能

  • 收集前端错误(原生、React、Vue)
  • 编写错误上报逻辑
  • 利用 Egg.js 编写一个错误日志采集服务
  • 编写 webpack 插件自动上传 sourcemap
  • 利用 sourcemap 还原压缩代码源码位置
  • 利用 Jest 进行单元测试

工作流程

  1. 收集错误
  2. 上报错误
  3. 代码上线打包将 sourcemap 文件上传至错误监控服务器
  4. 发生错误时监控服务器接收错误并记录到日志中
  5. 根据 sourcemap 和错误日志内容进行错误分析

一、 前端异常监控平台解决的问题

前端异常监控系统就是为了解决前端系统上线后的稳定性问题。一旦前端系统上线,发生运行异常造成页面阻塞,操作不流畅甚至无法打开网页的状况。我们需要通过技术手段收集、上报、分析异常才能保证前端项目稳定运行。

二、异常收集

首先先看看如何捕获异常。

1. JS 异常

js 异常的特点是,出现不会导致 JS 引擎崩溃 最多只会终止当前执行的任务。比如一个页面有两个按钮,如果点击按钮发生异常页面,这个时候页面不会崩溃,只是这个按钮的功能失效,其他按钮还会有效。

setTimeout(() => {
console.log('1->begin')
error
console.log('1->end')
})
setTimeout(() => {
console.log('2->begin')
console.log('2->end')
})
复制代码

image-20200205170222376

上面的例子我们用 setTimeout 分别启动了两个任务,虽然第一个任务执行了一个错误的方法。程序执行停止了。但是另外一个任务并没有收到影响。

其实如果你不打开控制台都看不到发生了错误。好像是错误是在静默中发生的。

下面我们来看看这样的错误该如何收集。

1.1 try-catch

JS 作为一门高级语言我们首先想到的使用 try-catch 来收集。

setTimeout(() => {
try {
console.log('1->begin')
error
console.log('1->end')
} catch (e) {
console.log('catch',e)
}
})
复制代码

image-20200205172234075

如果在函数中错误没有被捕获,错误会上抛。

function fun1() {
console.log('1->begin')
error
console.log('1->end')
}
setTimeout(() => {
try {
fun1()
} catch (e) {
console.log('catch',e)
}
})
复制代码

image-20200205173058230控制台中打印出的分别是错误信息和错误堆栈。

读到这里大家可能会想那就在最底层做一个错误 try-catch 不就好了吗。确实作为一个从 java 转过来的程序员也是这么想的。但是理想很丰满,现实很骨感。我们看看下一个例子。

function fun1() {
console.log('1->begin')
error
console.log('1->end')
}

try {
setTimeout(() => {
fun1()

})
} catch (e) {
console.log('catch', e)
}
复制代码

image-20200205173548456

大家注意运行结果,异常并没有被捕获。

这是因为 JS 的 try-catch 功能非常有限一遇到异步就不好用了。那总不能为了收集错误给所有的异步都加一个 try-catch 吧,太坑爹了。其实你想想异步任务其实也不是由代码形式上的上层调用的就比如本例中的 settimeout。大家想想 eventloop 就明白啦,其实这些一步函数都是就好比一群没娘的孩子出了错误找不到家大人。当然我也想过一些黑魔法来处理这个问题比如代理执行或者用过的异步方法。算了还是还是再看看吧。

1.2 window.onerror

window.onerror 最大的好处就是可以同步任务还是异步任务都可捕获。

function fun1() {
console.log('1->begin')
error
console.log('1->end')
}
window.onerror = (...args) => {
console.log('onerror:',args)
}

setTimeout(() => {
fun1()
})
复制代码

image-20200205175601033

  • onerror 返回值

    onerror 还有一个问题大家要注意 如果返回返回 true 就不会被上抛了。不然控制台中还会看到错误日志。

1.3 监听 error 事件

window.addEventListener('error',() => {})

其实 onerror 固然好但是还是有一类异常无法捕获。这就是网络异常的错误。比如下面的例子。

<img src="./xxxxx.png">
复制代码

试想一下我们如果页面上要显示的图片突然不显示了,而我们浑然不知那就是麻烦了。

addEventListener 就是

window.addEventListener('error', args => {
console.log(
'error event:', args
);
return true;
},
true // 利用捕获方式
);
复制代码

运行结果如下:

image-20200206102602184

1.4 Promise 异常捕获

Promise 的出现主要是为了让我们解决回调地域问题。基本是我们程序开发的标配了。虽然我们提倡使用 es7 async/await 语法来写,但是不排除很多祖传代码还是存在 Promise 写法。

new Promise((resolve, reject) => {
abcxxx()
});
复制代码

这种情况无论是 onerror 还是监听错误事件都是无法捕获的

new Promise((resolve, reject) => {
error()
})
// 增加异常捕获
.catch((err) => {
console.log('promise catch:',err)
});
复制代码

除非每个 Promise 都添加一个 catch 方法。但是显然是不能这样做。

window.addEventListener("unhandledrejection", e => {
console.log('unhandledrejection',e)
});
复制代码

image-20200206111017073

我们可以考虑将 unhandledrejection 事件捕获错误抛出交由错误事件统一处理就可以了

window.addEventListener("unhandledrejection", e => {
throw e.reason
});
复制代码

1.5 async/await 异常捕获

const asyncFunc = () => new Promise(resolve => {
error
})
setTimeout(async() => {
try {
await asyncFun()
} catch (e) {
console.log('catch:',e)
}
})
复制代码

实际上 async/await 语法本质还是 Promise 语法。区别就是 async 方法可以被上层的 try/catch 捕获。

image-20200206113325907

如果不去捕获的话就会和 Promise 一样,需要用 unhandledrejection 事件捕获。这样的话我们只需要在全局增加 unhandlerejection 就好了。

image-20200206112730746

小结

异常类型同步方法异步方法资源加载Promiseasync/await
try/catch✔️✔️
onerror✔️✔️
error 事件监听✔️✔️✔️
unhandledrejection 事件监听✔️✔️

实际上我们可以将 unhandledrejection 事件抛出的异常再次抛出就可以统一通过 error 事件进行处理了。

最终用代码表示如下:

window.addEventListener("unhandledrejection", e => {
throw e.reason
});
window.addEventListener('error', args => {
console.log(
'error event:', args
);
return true;
}, true);
复制代码

2. Webpack 工程化项目中捕获异常

现在是前端工程化的时代,工程化导出的代码一般都是被压缩混淆后的。

比如:

setTimeout(() => {
xxx(1223)
}, 1000)
复制代码

image-20200207154545464

出错的代码指向被压缩后的 JS 文件,而 JS 文件长下图这个样子。

image-20200207154708908

如果想将错误和原有的代码关联起来就需要 sourcemap 文件的帮忙了。

sourceMap 是什么

简单说,sourceMap就是一个文件,里面储存着位置信息。

仔细点说,这个文件里保存的,是转换后代码的位置,和对应的转换前的位置。

那么如何利用 sourceMap 对还原异常代码发生的位置这个问题我们到异常分析这个章节再讲。

3. Vue 捕获异常

3.1 创建工程

利用 vue-cli 工具直接创建一个项目。

# 安装vue-cli
npm install -g @vue/cli

# 创建一个项目
vue create vue-sample

cd vue-sample
npm i
// 启动应用
npm run serve

复制代码

为了测试的需要我们暂时关闭 eslint 这里面还是建议大家全程打开 eslint

在 vue.config.js 进行配置

module.exports = {
// 关闭eslint规则
devServer: {
overlay: {
warnings: true,
errors: true
}
},
lintOnSave:false
}
复制代码

我们故意在 src/components/HelloWorld.vue

<script>
export default {
name: "HelloWorld",
props: {
msg: String
},
mounted() {
// 制造一个错误
abc()
}
};
</script>
```html

然后在src/main.js中添加错误事件监听

```js
window.addEventListener('error', args => {
console.log('error', error)
})
复制代码

这个时候 错误会在控制台中被打印出来,但是错误事件并没有监听到。

image-20200207165626482

3.2 handleError

为了对 Vue 发生的异常进行统一的上报,需要利用 vue 提供的 handleError 句柄。一旦 Vue 发生异常都会调用这个方法。

我们在 src/main.js

Vue.config.errorHandler = function (err, vm, info) {
console.log('errorHandle:', err)
}
复制代码

运行结果结果:

image-20200207171558588

4. React 捕获异常

4.1 创建项目

npx create-react-app react-sample
cd react-sample
yarn start

复制代码

我们 l 用 useEffect hooks 制造一个错误

import React ,{useEffect} from 'react';
import logo from './logo.svg';
import './App.css';

function App() {
useEffect(() => {
// 发生异常
error()
});

return (
<div className="App">
// ...略...
</div>
);
}

export default App;

复制代码

并且在 src/index.js 中增加错误事件监听逻辑

window.addEventListener('error', args => {
console.log('error', error)
})
复制代码

但是从运行结果看虽然输出了错误日志但是还是服务捕获。

image-20200207183546189

4.2 ErrorBoundary 标签

错误边界仅可以捕获其子组件的错误。错误边界无法捕获其自身的错误。如果一个错误边界无法渲染错误信息,则错误会向上冒泡至最接近的错误边界。这也类似于 JavaScript 中 catch {} 的工作机制。

创建 ErrorBoundary 组件

import React from 'react';
export default class ErrorBoundary extends React.Component {
constructor(props) {
super(props);
}

componentDidCatch(error, info) {
// 发生异常时打印错误
console.log('componentDidCatch',error)
}

render() {
return this.props.children;
}
}
复制代码

在 src/index.js 中包裹 App 标签

import ErrorBoundary from './ErrorBoundary'

ReactDOM.render(
<ErrorBoundary>
<App />
</ErrorBoundary>
, document.getElementById('root'));
复制代码

最终运行的结果

image-20200207185123353

5. 跨域代码异常

(待...)

6. IFrame 异常

(待...)

上一篇我们主要谈到的 JS 错误如何收集。这篇我们说说异常如何上报和分析。

三、异常上报

1. 选择通讯方式

1.1 动态创建 img 标签

其实上报就是要将捕获的异常信息发送到后端。最常用的方式首推动态创建标签方式。因为这种方式无需加载任何通讯库,而且页面是无需刷新的。基本上目前包括百度统计 Google 统计都是基于这个原理做的埋点。

new Image().src = 'http://localhost:7001/monitor/error'+ '?info=xxxxxx'
复制代码

image-20200206124035097

通过动态创建一个 img,浏览器就会向服务器发送 get 请求。可以把你需要上报的错误数据放在 querystring 字符串中,利用这种方式就可以将错误上报到服务器了。

1.2 Ajax 上报

实际上我们也可以用 ajax 的方式上报错误,这和我们再业务程序中并没有什么区别。在这里就不赘述。

2.1 上报哪些数据

image-20200206150411524

我们先看一下 error 事件参数:

属性名称含义类型
message错误信息string
filename异常的资源 urlstring
lineno异常行号int
colno异常列号int
error错误对象object
error.message错误信息string
error.stack错误信息string

其中核心的应该是错误栈,其实我们定位错误最主要的就是错误栈。

错误堆栈中包含了绝大多数调试有关的信息。其中包括了异常位置(行号,列号),异常信息

有兴趣的同学可以看看这篇文章

github.com/dwqs/blog/i…

2.2 上报数据序列化

由于通讯的时候只能以字符串方式传输,我们需要将对象进行序列化处理。

大概分成以下三步:

  • 将异常数据从属性中解构出来存入一个 JSON 对象
  • 将 JSON 对象转换为字符串
  • 将字符串转换为 Base64

当然在后端也要做对应的反向操作 这个我们后面再说。


window.addEventListener('error', args => {
console.log(
'error event:', args
);
uploadError(args)
return true;
}, true);
function uploadError({
lineno,
colno,
error: {
stack
},
timeStamp,
message,
filename
}) {
// 过滤
const info = {
lineno,
colno,
stack,
timeStamp,
message,
filename
}
// const str = new Buffer(JSON.stringify(info)).toString("base64");
const str = window.btoa(JSON.stringify(info))
const host = 'http://localhost:7001/monitor/error'
new Image().src = `${host}?info=${str}`
}
复制代码

四、异常收集

异常上报的数据一定是要有一个后端服务接收才可以。

我们就以比较流行的开源框架 eggjs 为例来演示

1. 搭建 eggjs 工程

# 全局安装egg-cli
npm i egg-init -g
# 创建后端项目
egg-init backend --type=simple
cd backend
npm i
# 启动项目
npm run dev
复制代码

2. 编写 error 上传接口

首先在 app/router.js 添加一个新的路由

module.exports = app => {
const { router, controller } = app;
router.get('/', controller.home.index);
// 创建一个新的路由
router.get('/monitor/error', controller.monitor.index);
};
复制代码

创建一个新的 controller (app/controller/monitor)

'use strict';

const Controller = require('egg').Controller;
const { getOriginSource } = require('../utils/sourcemap')
const fs = require('fs')
const path = require('path')

class MonitorController extends Controller {
async index() {
const { ctx } = this;
const { info } = ctx.query
const json = JSON.parse(Buffer.from(info, 'base64').toString('utf-8'))
console.log('fronterror:', json)
ctx.body = '';
}
}

module.exports = MonitorController;

复制代码

image-20200206163420155

看一下接收后的结果

3. 记入日志文件

下一步就是讲错误记入日志。实现的方法可以自己用 fs 写,也可以借助 log4js 这样成熟的日志库。

当然在 eggjs 中是支持我们定制日志那么我么你就用这个功能定制一个前端错误日志好了。

在/config/config.default.js 中增加一个定制日志配置

// 定义前端错误日志
config.customLogger = {
frontendLogger : {
file: path.join(appInfo.root, 'logs/frontend.log')
}
}
复制代码

在/app/controller/monitor.js 中添加日志记录

async index() {
const { ctx } = this;
const { info } = ctx.query
const json = JSON.parse(Buffer.from(info, 'base64').toString('utf-8'))
console.log('fronterror:', json)
// 记入错误日志
this.ctx.getLogger('frontendLogger').error(json)
ctx.body = '';
}
复制代码

最后实现的效果

image-20200206171529549

五、异常分析

谈到异常分析最重要的工作其实是将 webpack 混淆压缩的代码还原。

1. Webpack 插件实现 SourceMap 上传

在 webpack 的打包时会产生 sourcemap 文件,这个文件需要上传到异常监控服务器。这个功能我们试用 webpack 插件完成。

1.1 创建 webpack 插件

/source-map/plugin

const fs = require('fs')
var http = require('http');

class UploadSourceMapWebpackPlugin {
constructor(options) {
this.options = options
}

apply(compiler) {
// 打包结束后执行
compiler.hooks.done.tap("upload-sourcemap-plugin", status => {
console.log('webpack runing')
});
}
}

module.exports = UploadSourceMapWebpackPlugin;

复制代码

1.2 加载 webpack 插件

webpack.config.js

// 自动上传Map
UploadSourceMapWebpackPlugin = require('./plugin/uploadSourceMapWebPackPlugin')

plugins: [
// 添加自动上传插件
new UploadSourceMapWebpackPlugin({
uploadUrl:'http://localhost:7001/monitor/sourcemap',
apiKey: 'kaikeba'
})
],

复制代码

1.3 添加读取 sourcemap 读取逻辑

在 apply 函数中增加读取 sourcemap 文件的逻辑

/plugin/uploadSourceMapWebPlugin.js

const glob = require('glob')
const path = require('path')
apply(compiler) {
console.log('UploadSourceMapWebPackPlugin apply')
// 定义在打包后执行
compiler.hooks.done.tap('upload-sourecemap-plugin', async status => {
// 读取sourcemap文件
const list = glob.sync(path.join(status.compilation.outputOptions.path, `./**/*.{js.map,}`))
for (let filename of list) {
await this.upload(this.options.uploadUrl, filename)
}
})
}
复制代码

1.4 实现 http 上传功能

upload(url, file) {
return new Promise(resolve => {
console.log('uploadMap:', file)

const req = http.request(
`${url}?name=${path.basename(file)}`,
{
method: 'POST',
headers: {
'Content-Type': 'application/octet-stream',
Connection: "keep-alive",
"Transfer-Encoding": "chunked"
}
}
)
fs.createReadStream(file)
.on("data", chunk => {
req.write(chunk);
})
.on("end", () => {
req.end();
resolve()
});
})
}
复制代码

1.5 服务器端添加上传接口

/backend/app/router.js

module.exports = app => {
const { router, controller } = app;
router.get('/', controller.home.index);
router.get('/monitor/error', controller.monitor.index);
// 添加上传路由
router.post('/monitor/sourcemap',controller.monitor.upload)
};

复制代码

添加 sourcemap 上传接口

/backend/app/controller/monitor.js

async upload() {
const { ctx } = this
const stream = ctx.req
const filename = ctx.query.name
const dir = path.join(this.config.baseDir, 'uploads')
// 判断upload目录是否存在
if (!fs.existsSync(dir)) {
fs.mkdirSync(dir)
}

const target = path.join(dir, filename)
const writeStream = fs.createWriteStream(target)
stream.pipe(writeStream)
}
复制代码

最终效果:

执行 webpack 打包时调用插件 sourcemap 被上传至服务器。

image-20200206202732716

2. 解析 ErrorStack

考虑到这个功能需要较多逻辑,我们准备把他开发成一个独立的函数并且用 Jest 来做单元测试

先看一下我们的需求

输入stack(错误栈)ReferenceError: xxx is not defined\n' + ' at http://localhost:7001/public/bundle.e7877aa7bc4f04f5c33b.js:1:1392'
SourceMap
输出源码错误栈{ source: 'webpack:///src/index.js', line: 24, column: 4, name: 'xxx' }

搭建 Jest 框架

image-20200207113234836

首先创建一个/utils/stackparser.js 文件

module.exports = class StackPaser {
constructor(sourceMapDir) {
this.consumers = {}
this.sourceMapDir = sourceMapDir
}
}

复制代码

在同级目录下创建测试文件 stackparser.spec.js

以上需求我们用 Jest 表示就是

const StackParser = require('../stackparser')
const { resolve } = require('path')
const error = {
stack: 'ReferenceError: xxx is not defined\n' +
' at http://localhost:7001/public/bundle.e7877aa7bc4f04f5c33b.js:1:1392',
message: 'Uncaught ReferenceError: xxx is not defined',
filename: 'http://localhost:7001/public/bundle.e7877aa7bc4f04f5c33b.js'
}

it('stackparser on-the-fly', async () => {

const stackParser = new StackParser(__dirname)

// 断言
expect(originStack[0]).toMatchObject(
{
source: 'webpack:///src/index.js',
line: 24,
column: 4,
name: 'xxx'
}
)
})

复制代码

整理如下:

下面我们运行 Jest

npx jest stackparser --watch
复制代码

image-20200207114208691

显示运行失败,原因很简单因为我们还没有实现对吧。下面我们就实现一下这个方法。

2.1 反序列 Error 对象

首先创建一个新的 Error 对象 将错误栈设置到 Error 中,然后利用 error-stack-parser 这个 npm 库来转化为 stackFrame

const ErrorStackParser = require('error-stack-parser')
/**
* 错误堆栈反序列化
* @param {*} stack 错误堆栈
*/
parseStackTrack(stack, message) {
const error = new Error(message)
error.stack = stack
const stackFrame = ErrorStackParser.parse(error)
return stackFrame
}
复制代码

运行效果

image-20200207115955932

2.2 解析 ErrorStack

下一步我们将错误栈中的代码位置转换为源码位置

const { SourceMapConsumer } = require("source-map");
async getOriginalErrorStack(stackFrame) {
const origin = []
for (let v of stackFrame) {
origin.push(await this.getOriginPosition(v))
}

// 销毁所有consumers
Object.keys(this.consumers).forEach(key => {
console.log('key:',key)
this.consumers[key].destroy()
})
return origin
}

async getOriginPosition(stackFrame) {
let { columnNumber, lineNumber, fileName } = stackFrame
fileName = path.basename(fileName)
console.log('filebasename',fileName)
// 判断是否存在
let consumer = this.consumers[fileName]

if (consumer === undefined) {
// 读取sourcemap
const sourceMapPath = path.resolve(this.sourceMapDir, fileName + '.map')
// 判断目录是否存在
if(!fs.existsSync(sourceMapPath)){
return stackFrame
}
const content = fs.readFileSync(sourceMapPath, 'utf8')
consumer = await new SourceMapConsumer(content, null);
this.consumers[fileName] = consumer
}
const parseData = consumer.originalPositionFor({ line:lineNumber, column:columnNumber })
return parseData
}
复制代码

我们用 Jest 测试一下

it('stackparser on-the-fly', async () => {

const stackParser = new StackParser(__dirname)
console.log('Stack:',error.stack)
const stackFrame = stackParser.parseStackTrack(error.stack, error.message)
stackFrame.map(v => {
console.log('stackFrame', v)
})
const originStack = await stackParser.getOriginalErrorStack(stackFrame)

// 断言
expect(originStack[0]).toMatchObject(
{
source: 'webpack:///src/index.js',
line: 24,
column: 4,
name: 'xxx'
}
)
})
复制代码

image-20200207120534213

看一下结果测试通过。

2.3 将源码位置记入日志

async index() {
console.log
const { ctx } = this;
const { info } = ctx.query
const json = JSON.parse(Buffer.from(info, 'base64').toString('utf-8'))
console.log('fronterror:', json)

// 转换为源码位置
const stackParser = new StackParser(path.join(this.config.baseDir, 'uploads'))
const stackFrame = stackParser.parseStackTrack(json.stack, json.message)
const originStack = await stackParser.getOriginalErrorStack(stackFrame)
this.ctx.getLogger('frontendLogger').error(json,originStack)

ctx.body = '';
}
复制代码

运行效果:

image-20200207122613284

六、开源框架实战

Sentry

Sentry 是一个开源的实时错误追踪系统,可以帮助开发者实时监控并修复异常问题。它主要专注于持续集成、提高效率并且提升用户体验。Sentry 分为服务端和客户端 SDK,前者可以直接使用它家提供的在线服务,也可以本地自行搭建;后者提供了对多种主流语言和框架的支持,包括 React、Angular、Node、Django、RoR、PHP、Laravel、Android、.NET、JAVA 等。同时它可提供了和其他流行服务集成的方案,例如 GitHub、GitLab、bitbuck、heroku、slack、Trello 等。目前公司的项目也都在逐步应用上 Sentry 进行错误日志管理。

2. Fundebug

Fundebug专注于 JavaScript、微信小程序、微信小游戏、支付宝小程序、React Native、Node.js 和 Java 线上应用实时 BUG 监控。 自从 2016 年双十一正式上线,Fundebug 累计处理了 10 亿+错误事件,付费客户有阳光保险、荔枝 FM、掌门 1 对 1、核桃编程、微脉等众多品牌企业。欢迎免费试用!

总结

截止到目前为止,我们把前端异常监控的基本功能算是形成了一个 MVP(最小化可行产品)。后面需要升级的还有很多,对错误日志的分析和可视化方面可以使用 ELK。发布和部署可以采用 Docker。对 eggjs 的上传和上报最好要增加权限控制功能。

参考代码位置: github.com/su37josephx…

欢迎指正,欢迎 Star。

总结

截止到目前为止,我们把前端异常监控的基本功能算是形成了一个 MVP(最小化可行产品)。后面需要升级的还有很多,对错误日志的分析和可视化方面可以使用 ELK。发布和部署可以采用 Docker。对 eggjs 的上传和上报最好要增加权限控制功能。

参考代码位置: github.com/su37josephx…

欢迎指正,欢迎 Star。